利用C语言获取网页源代码(待研究,HTTP协议)
来源:互联网 发布:上海去哪里买特产 知乎 编辑:程序博客网 时间:2024/05/21 16:51
点击打开链接
利用C语言获取网页源代码
#include <stdio.h>
#include <winsock.h>
#include <string.h>
#pragma comment(lib, "ws2_32.lib")
void geturl(char *url)
{
WSADATA WSAData={0};
SOCKET sockfd;
struct sockaddr_in addr;
struct hostent *pURL;
char myurl[BUFSIZ];
char *pHost = 0, *pGET = 0;
char host[BUFSIZ], GET[BUFSIZ];
char header[BUFSIZ] = "";
static char text[BUFSIZ];
int i;
/*
* windows下使用socket必须用WSAStartup初始化,否则不能调用
*/
if(WSAStartup(MAKEWORD(2,2), &WSAData))
{
printf("WSA failed/n");
return;
}
/*
* 分离url中的主机地址和相对路径
*/
strcpy(myurl, url);
for (pHost = myurl; *pHost != '/' && *pHost != '/0'; ++pHost);
if ( (int)(pHost - myurl) == strlen(myurl) )
strcpy(GET, "/");
else
strcpy(GET, pHost);
*pHost = '/0';
strcpy(host, myurl);
printf("%s/n%s/n", host, GET);
/*
* 设定socket参数,并未真正初始化
*/
sockfd = socket(PF_INET, SOCK_STREAM, IPPROTO_TCP);
pURL = gethostbyname(host);
addr.sin_family = AF_INET;
addr.sin_addr.s_addr = *((unsigned long*)pURL->h_addr);
addr.sin_port = htons(80);
/*
* 组织发送到web服务器的信息
* 为何要发送下面的信息请参考HTTP协议的约定
*/
strcat(header, "GET ");
strcat(header, GET);
strcat(header, " HTTP/1.1/r/n");
strcat(header, "HOST: ");
strcat(header, host);
strcat(header, "/r/nConnection: Close/r/n/r/n");
/*
* 连接到服务器,发送请求header,并接受反馈(即网页源代码)
*/
connect(sockfd,(SOCKADDR *)&addr,sizeof(addr));
send(sockfd, header, strlen(header), 0);
while ( recv(sockfd, text, BUFSIZ, 0) > 0)
{
printf("%s", text);
strnset(text, '/0', BUFSIZ);
}
closesocket(sockfd);
WSACleanup();
}
int main()
{
char url[256];
printf("http://");
scanf("%s", url);
geturl(url);
return 0;
}
还是挺有用的!
0 0
- 利用C语言获取网页源代码(待研究,HTTP协议)
- 利用C语言获取网页源代码
- 利用C语言获取网页源代码
- android利用Http协议获取网页文本内容的方法
- linux下C语言如何获取网页源代码
- HTTP协议分析(待)
- VC++通过HTTP方式获取网页源代码
- web:初识http协议(待补充)
- http协议-----待学
- HTTP协议--待学
- 利用ServerSocket获取浏览器http协议内容
- 利用ServerSocket获取浏览器http协议内容
- C++获取网页源代码
- C语言实现抓取网页源代码
- 利用PHP获取网页的源代码或标题
- 利用PHP获取网页的源代码或标题
- c#利用WebClient和WebRequest获取网页源代码的比较
- c#利用WebClient和WebRequest获取网页源代码的比较
- ubuntu 以管理员权限打开文件夹
- 句子逆序
- 425 Can't open data connection 问题解决
- 构造回文
- leetcode206. Reverse Linked List
- 利用C语言获取网页源代码(待研究,HTTP协议)
- 算法基础-字符移位
- 基于C语言的sprintf函数的理解
- Ubuntu16.04环境下写第一个C语言程序
- iOS 10隐藏APP图标 – 让隐私的APP从桌面上消失
- gets()用法
- 字符串反转
- 二维数组的初始化
- 数字颠倒