`
liuxinglanyue
  • 浏览: 544051 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论
文章列表
  主博客是:http://www.liuxinglanyue.com/   主论坛是:http://bbs.liuxinglanyue.com/   论坛崩溃掉了。                这个论坛已于2011-2-18日恢复。   欢迎对论坛的版块设置提供改进意见,谢谢。   同时也欢迎在论坛里交流技术。   这里有个论坛:http://java.liuxinglanyue.com/ 支持google账户直接登录,支持Gravatar 更改你的头像   新浪微博地址:http://t.sina.com.cn/liuxinglanyue
        我的博客:http://www.liuxinglanyue.com/         欢迎来踩。         其实谈不上总结,而是生活的一段剪影。         直到昨天晚上,我注册的域名(liuxinglanyue.com)终于和博客绑定了。这中间还是遇到了不少问题,不 ...
IBM技术文档库   阿里巴巴(软件)开发者博客 淘宝数据平台与产品部官方博客 搜索引擎研究团队   车东[Blog^2]
HttpClient4 Post XML到一个服务器上 纯Java文件操作工具,支持文件、文件夹的复制、删除、移动 山寨版Log4j Java反射深度测试 深入理解HTTP Session 深入理解ServletRequest与ServletResponse Java字符编码根本原理 Servlet接收JSP参数乱码问题解决办法 JDBC数据源(DataSource)的简单实现 Java应用程序工程模板 Java线程:深入ThreadLocal Java线程:线程私有变量 揭开Annotation的面纱 Java字符集编码与转码 纯JDBC系
强烈推荐,适合入门,适合深入 http://www.cnpythoner.com/
原文 http://www.hetland.org/python/instant-hacking.php Instant Hacking[译文] 译者: 肯定来过                                       这是一篇简短的关于python程序设计语言的入门教程,原文在这里,翻着词典翻译了来! ...
python所支持的数据类型:整型、长整型、布尔型、浮点型、复数、字符串、列表(list)、元组(Tuple)、字典(Dict)、object python能支持理论意义上的长整型,如C#中的长整型是Int64,即最大值为2的64次方,而python中的长整型只与机器的虚拟内存大小有关,你完全不用考虑溢出这样的异常。 python是一种动态语言,虽然在定义变量时无需定义变量的类型,但并不意味着在运行的过程中,你可以随时更改变量的类型,所以,python是一种强类型的动态语言,它与asp/javascript/php完全不一样,比如: >>> a=123 ...
注释(#): python中的注释是以#开头的,不像c++中有/**/之类的多行注释。 继续():表示继续上一行,通常情况下,一行表示一个语句,一行过长的语句可以使用进行分解 语句块(:):在c#/php/javascript/c++中,对于复合语句是用{}来 ...
python3.0已推出,但据说很多库都不能用了,建议使用2.6版本,我目前使用的是2.5版,与2.6版差距不大。 注意:2.6版本开始,print需要加上括号,否则会提示语法错误。 安装python运行环境: 下载for windows的安装包,http://www.python.org/,不过,正式对外的下载地址被和谐了,请移步到这里下载:http://www.python.org/ftp/python/ 运行下载的.msi文件执行安装程序,默认会安装在系统盘符:/python25目录下,当然你可以更改该目录,但建议使用默认值,安装完成后会自动注册环境变量 运行cm ...
五、为HTML文档中的属性值添加引号   前面我们讨论了如果根据HTML解析器中的某种处理程序来解析HTML文件,可是有时候我们却需要使用所有的处理程序来处理HTML文档。值得庆幸的是,使用HTMLParser模块解析HTML文件的所有要素并不比处理链接或者图像难多少。   import HTMLParser  import urllib  class parseAttrs(HTMLParser.HTMLParser):  def handle_starttag(self, tag, attrs):  . . .
 对搜索引擎、文件索引、文档转换、数据检索、站点备份或迁移等应用程序来说,经常用到对网页(即HTML文件)的解析处理。事实上,通过Python语言提供的各种模块,我们无需借助Web服务器或者Web浏览器就能够解析和处理HTML文档。本文上篇中,我们介绍了一个可以帮助简化打开位于本地和Web上的HTML文档的Python模块。在本文中,我们将论述如何使用Python模块来迅速解析在HTML文件中的数据,从而处理特定的内容,如链接、图像和Cookie等。同时还会介绍如何规范HTML文件的格式标签。   一、从HTML文档中提取链接   Python语言还有一个非常有用的模块HTMLParse ...
对搜索引擎、文件索引、文档转换、数据检索、站点备份或迁移等应用程序来说,经常用到对网页(即HTML文件)的解析处理。事实上,通过Python语言提供的各种模块,我们无需借助Web服务器或者Web浏览器就能够解析和处理HTML文档。本文将详细介绍如何利用Python抓取和解析网页。首先,我们介绍一个可以帮助简化打开位于本地和Web上的HTML文档的Python模块,然后,我们论述如何使用Python模块来迅速解析在HTML文件中的数据,从而处理特定的内容,如链接、图像和Cookie等。最后,我们会给出一个规整HTML文件的格式标签的例子,通过这个例子您会发现使用python处理HTML文件的内容是 ...
1. 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?       方案1:可以估计每个文件安的大小为50G×64=320G,远远大于内存限制的4G。所以不可能将其完全加载到内存中处理。考虑采取分而治之的方法。        (1)遍历文件a,对每个url求取clip_image002,然后根据所取得的值将url分别存储到1000个小文件(记为 clip_image004)中。这样每个小文件的大约为300M。        (2)遍历文件b,采取和a相同的方式将url分别存储到1000各小文件(记为clip_image00 ...
Java深度历险(一)——Java字节代码的操纵 Java深度历险(二)——Java类的加载、链接和初始化    
A.关于推荐系统的综述说明 推荐系统:主要推荐方法 电子商务推荐系统入门基础 电子商务推荐系统研究综述 Collaborative Filtering 为什么基于项目的协同过滤是稳定的. 个性化推荐系统的研究进展[和朋友一起写的小综述] 推荐系统:
Global site tag (gtag.js) - Google Analytics