译者序+前言+第一章

来源:互联网 发布:java响应ajax请求 编辑:程序博客网 时间:2024/05/11 13:09

译者序

web2.0

      Web2.0,是相对Web1.0(2003年以前的互联网模式)的新的一类互联网应用的统称。
Web1.0到Web2.0的转变,具体的说,从模式上是单纯的“读”向“写”、“共同建设”发展;由被动地接收互联网信息向主动创造互联网信息迈进!从基本构成单元上,是由“网页”向“发表/记录的信息”发展;从工具上,是由互联网浏览器向各类浏览器、rss阅读器等内容发展;运行机制上,由“Client Server”向“Web Services”转变;作者由程序员等专业人士向全部普通用户发展;应用上由初级的“滑稽”的应用向全面大量应用发展。 

      总之,Web2.0是以 Flickr、Craigslist、Linkedin、Tribes、Ryze、 Friendster、Del.icio.us、43Things.com等网站为代表,以Blog、TAG、SNS、RSS、wiki等应用为核心,依据六度分隔、xml、ajax等新理论和技术实现的互联网新一代模式。

Google AdSense

      是一种获取收入的快速简便的方法,适合于各种规模的网站发布商。它可以在网站的内容网页上展示相关性较高的 Google广告,并且这些广告不会过分夸张醒目。由于这些所展示的广告内容同用户在您的网站上查找的内容相关,因此,最终您的内容网页不仅仅会为您带来很好的经济效益,还能够得以充实网站内容页面。google根据网站上显示的广告被点击的次数支付佣金,当某个月底佣金累计达到100美元时即可向发布商支付广告佣金。

      Google AdSense开创了一个新的广告模式吧。以前的很多广告商,主要靠在各种页面,高频率的轰炸网友的眼球,而不管这个网友对广告内容是不是感兴趣。但是AdSense却通过分析网页内容后,提供一些和内容相关的文字广告(也会有个别图片广告),因为内容相关的广告更容易引起读者的兴趣,使广告成为一种真正有用的信息,而且也不会给网友太多的骚扰。

复用性

1、  代码的剪贴复用:最初步的复用,每块代码分散在各处,独立的演变,仍需要针对每一块修改和测试。这种复用带来的好处很有限。2、  算法的复用:在已有的成熟算法中选择一个比自己重新开发一个好的多。比如排序算法。这就是算法的复用。3、  数据结构的复用:比如队列、栈、链表,在实践中得到了大量的应用。

前言

静态类型语言

是指需要进行变量/对象类型声明的语言,一般情况下需要编译执行。例如C/C++/Java/C#。

动态类型语言

是指不需要进行变量/对象类型声明的语言,一般情况下不需要编译(但也有编译型的)。例如PHP/ASP/Ruby/Python/Perl/ABAP/SQL/JavaScript/Unix Shell等等。

RSS

      RSS就像一个网站的海报,里面包括这个网站的最新内容,会自动更新。所以,我们只要订阅了RSS,就不会错过自己喜欢的网站的更新了。
  但是光有海报还不行,还必须有海报栏,也就是说必须有RSS阅读器才行。因为RSS只是数据源,它本身是写给程序看的,必须经过阅读器转换,才能成为可以浏览的格式。

为了更好地组织类,Java提供了包机制。包是类的容器,用于分隔类名空间。如果没有指定包名,所有的示例都属于一个默认的无名包。

过程式编程

过程式编程VS面向对象编程


第一章 集体智慧导论

数据挖掘的应用:提供推荐、搜索引擎:搜索相关性、约会网站找到最佳拍档、预测机票价格变化、创造更有针对性的广告、金融市场预测、定制自己的音乐电台。

什么是集体智慧

集体智慧通常是指:为了创造新的想法,将一群人的行为、偏好或思想组合在一起。
从一群人中搜集组合和分析数据最基础的方法:使用调查问卷或普查。

什么是机器学习

机器学习-模式-归纳-模型

机器学习的局限

真实生活中的例子

学习型算法的其他用途

生物工艺学:测序技术和筛选技术、金融欺诈侦测、机器视觉:辨别车辆和识别认脸等、产品市场化 、供应链优化:预测不同区域的产品需求、股票市场分析、 国家安全。

独立组元分析技术:独立成分分析独立分量分析(Independent components analysis,缩写:ICA) 是一种利用统计原理进行计算的方法。