IT桔子分布式项目1
来源:互联网 发布:mac svn checkout 编辑:程序博客网 时间:2024/04/29 02:08
IT桔子是关注IT互联网行业的结构化的公司数据库和商业信息服务提供商,于2013年5月21日上线。
IT桔子致力于通过信息和数据的生产、聚合、挖掘、加工、处理,帮助目标用户和客户节约时间和金钱、提高效率,以辅助其各类商业行为,包括风险投资、收购、竞争情报、细分行业信息、国外公司产品信息数据服务等。
用于需自行对所发表或采集的内容负责,因所发表或采集的内容引发的一切纠纷、损失,由该内容的发表或采集者承担全部直接或间接(连带)法律责任,IT桔子不承担任何法律责任。
项目采集地址:http://www.itjuzi.com/company
要求:采集页面下所有创业公司的公司信息,包括以下但不限于:
# items.py# -*- coding: utf-8 -*-import scrapyclass CompanyItem(scrapy.Item): # 公司id (url数字部分) info_id = scrapy.Field() # 公司名称 company_name = scrapy.Field() # 公司口号 slogan = scrapy.Field() # 分类 scope = scrapy.Field() # 子分类 sub_scope = scrapy.Field() # 所在城市 city = scrapy.Field() # 所在区域 area = scrapy.Field() # 公司主页 home_page = scrapy.Field() # 公司标签 tags = scrapy.Field() # 公司简介 company_intro = scrapy.Field() # 公司全称: company_full_name = scrapy.Field() # 成立时间: found_time = scrapy.Field() # 公司规模: company_size = scrapy.Field() # 运营状态 company_status = scrapy.Field() # 投资情况列表:包含获投时间、融资阶段、融资金额、投资公司 tz_info = scrapy.Field() # 团队信息列表:包含成员姓名、成员职称、成员介绍 tm_info = scrapy.Field() # 产品信息列表:包含产品名称、产品类型、产品介绍 pdt_info = scrapy.Field()
阅读全文
0 0
- IT桔子分布式项目1
- IT桔子分布式项目2
- IT桔子IT互联网公司产品数据库及商业信息服务
- IT桔子沙龙第6期:本地生活服务探路者
- IT桔子沙龙之本地生活服务O2O探路者笔记整理
- 每日风险投资速递(10月26日,IT桔子收录21起投资/收购事件)
- 桔子浏览器|1M安装包|hao123专属浏览器
- IT项目管理实践经验1
- IT桔子2013年度中国互联网创业投资盘点(简版): 群雄逐鹿中,你还在这里坚持
- IT桔子沙龙第71期:2016年智能硬件创投趋势探讨(上海场)
- linux--------------git分布式系统项目管理(1)
- 桔子的爱情
- [转]桔子的爱情
- 【桔子】 之一 偶遇
- 分桔子问题
- 冬天的桔子
- 1638: 遍地桔子
- 递归求桔子数
- 通过英迈了解海航科技集团怎么样
- CPU的组成结构及其原理(三)
- 解决node、npm 安装缺libicu18.so.48 问题
- JavaScript 数据类型转换
- iOS11 & iPhoneX适配指南
- IT桔子分布式项目1
- Spark Streaming之updateStateByKey和mapWithState比较
- 预定义变量
- Tomcat8.0.7 配置好后tomcat8w无法运行
- Java实训——编写一个窗体程序,能够对文本区中的文字设置字体和大小。
- SQLite数据库升级
- IT桔子分布式项目2
- 解决checkbox全选按钮只生效一次的问题
- 嗯,第一篇csdn博客