Craigslist 的数据库架构
来源:互联网 发布:adb修改端口 编辑:程序博客网 时间:2024/05/08 11:57
Craigslist 绝对是互联网的一个传奇公司。根据以前的一则报道:
每月超过 1000 万人使用该站服务,月浏览量超过 30 亿次,(Craigslist每月新增的帖子近 10 亿条??)网站的网页数量在以每年近百倍的速度增长。Craigslist 至今却只有 18 名员工(现在可能会多一些了)。
Tim O'reilly 采访了 Craigslist 的 Eric Scheide ,于是通过这篇 Database War Stories #5: craigslist 我们能了解一下 Craigslist 的数据库架构以及数据量信息。
数据库软件使用 MySQL 。为充分发挥 MySQL 的能力,数据库都使用 64 位 Linux 服务器, 14 块 本地磁盘(72*14=1T ?), 16G 内存。
不同的服务使用不同方式的数据库集群。
论坛
1 主(master) 1 从(slave)。Slave 大多用于备份. myIsam 表. 索引达到 17G。最大的表接近 4200 万行。
分类信息
1 主 12 从。 Slave 各有个的用途. 当前数据包括索引有 114 G , 最大表有 5600 万行(该表数据会定期归档)。 使用 myIsam。分类信息量有多大? "Craigslist每月新增的帖子近 10 亿条",这句话似乎似乎有些夸张,Eric Scheide 说昨日就超过 330000 条数据,如果这样估计的话,每个月的新帖子信息大约在 1 亿多一些。
归档数据库
1 主 1 从. 放置所有超过 3 个月的帖子。与分类信息库结构相似但是更大, 数据有 238G, 最大表有 9600 万行。大量使用 Merge 表,便于管理。
搜索数据库
4 个 集群用了 16 台服务器。活动的帖子根据 地区/种类划分,并使用 myIsam 全文索引,每个只包含一个子集数据。该索引方案目前还能撑住,未来几年恐怕就不成了。
Authdb
1 主 1 从,很小。
目前 Craigslist 在 Alexa 上的排名是 30,上面的数据只是反映采访当时(April 28, 2006)的情况,毕竟,Craigslist 数据量还在每年 200% 的速度增长。
Craigslist 采用的数据解决方案从软硬件上来看还是低成本的。优秀的 MySQL 数据库管理员对于 Web 2.0 项目是一个关键因素。
- Craigslist 的数据库架构
- Craigslist 的数据库架构
- Craigslist 的数据库架构
- Craigslist 的数据库架构
- Craigslist的LAMP架构
- Craigslist 的数据库架构(作者:Fenng/dbanotes.net)
- Craigslist的创业神话
- Craigslist :一个神奇的网站
- Craigslist:探访美国最火的分类广告网站
- 数据库的三层架构
- 数据库的三层架构
- 数据库的简单架构
- 数据库架构的演变
- 数据库架构的演变
- 数据库架构的演变
- 数据库架构的演变
- 数据库架构的演变
- 数据库架构的理解
- c++内存释放的几种方法
- C#无焦点按钮(非自定义控件)
- 了解一下 Technorati 的后台数据库架构
- 内存对齐
- 快捷键
- Craigslist 的数据库架构
- ftp协议c语言实现-linux平台
- 国际化和本地化
- 一些CSS技巧
- 提取图片中任意形状的区域
- 从木桶现象谈售前技能的选择
- Visual Studio 2010在敏捷开发中的实践应用
- 数据类型与运算符
- 单文档多视图+MFC多文档多视图编程