vlambda博客
学习文章列表

Linux-C 编程 / 网络 / 超迷你的 web server


Linux-C 编程 / 网络 / 超迷你的 web server

一、为生活寻找固定的支撑点

1. 什么是生活的支撑点?

  • 让自己感到些许痛苦,但却会带来实实在在的充实感和成就感的事情。

  • 举个栗子,我的支点是运动、看书、研究技术。

2. 固定的支撑点很重要:

  • 三个固定的要素:时间 / 空间 / 事情。

  • 无论发生什么,无论今天你在什么地方,处于怎样的阶段,有哪些安排,你都坚持做这件事,而且一大早起来,就开始执行。

  • 这是一个很强大的心理暗示:只要拥有这些稳定不变的支撑点,你就有信心和足够的能力去面对许多生活里不稳定的东西,并解决掉它们。

二、Linux-C 编程 / 超迷你的 web server

0. 什么是 web server?

web server 有两个意思:

  1. 一台负责提供网页的主机,它通过 http 协议将网页等数据传给客户端(一般是浏览器);

  2. 一个提供网页的服务器程序,例如 Apache / Nginix / lighttped 等;

1. Tinyhttpd 简介

开源项目 Tinyhttpd ( 6K star / 2.8K fork):

官网:

  • https://sourceforge.net/projects/tinyhttpd/

github mirror:

  • https://github.com/EZLippi/Tinyhttpd

中文注释代码:

  • https://github.com/cbsheng/tinyhttpd

Tinyhttpd 是一个 C 语言编写、极度简陋的 web 服务器,也可以叫 http 服务器。

它的作用仅仅是用于学习 http 协议和 UNIX 系统调用, 不能用于生产环境中。

虽然它没有任何商业价值,但是非常适合用来了解 WEB 服务器的基础知识。

我们可以用它作为我们学习 Mpjg-streamer / Nginx/ Lighttpd 等更 复杂和更优秀开源项目的跳板。

2. 编译运行

编译运行:

$ git clone https://github.com/EZLippi/Tinyhttpd
$ cd tinyhttpd-0.1.0
$ make
$ ./httpd 
httpd running on port 4000

用浏览器访问:

Linux-C 编程 / 网络 / 超迷你的 web server

点击查看大图

用命令访问:

  1. 使用 netstat 查看 tinyhttpd 的网络状态:
$ netstat -ant | grep 4000
tcp        0      0 0.0.0.0:4000            0.0.0.0:*               LISTEN 
  1. 使用 nc 连接 tinyhttpd,并手动发送 http 请求:
$ nc 127.0.0.1 4000
GET /index.html HTTP/1.1   // 输入 http 请求

HTTP/1.0 200 OK            // 接收到 http 响应
Server: es-hacker-httpserver
Content-Type: text/html

<HTML>
<TITLE>Index</TITLE>
<BODY>
<H1>This is a simple webserver
</BODY>
</HTML>
  1. 使用 curl 给 tinyhttpd 发送 http 请求:
$ curl localhost:4000/index.html
<HTML>
<TITLE>Index</TITLE>
<BODY>
<H1>This is a simple webserver
</BODY>
</HTML>

使用 wireshark 抓包:

Linux-C 编程 / 网络 / 超迷你的 web server

点击查看大图

(1) 浏览器:“请给我 ××× 网页的数据。”

(2) web 服务器:“好的,这就是你要的数据。”

3. 了解一下内部实现

3.1 关于 web server 的入门知识

web server 和 http 协议在整个网络传输中的位置:

Linux-C 编程 / 网络 / 超迷你的 web server

点击查看大图

web server 处理请求的步骤:

详细一点的步骤:

Linux-C 编程 / 网络 / 超迷你的 web server

点击查看大图
  • 建立连接——接受一个客户端连接;
  • 接收请求——从网络中读取一条 http 请求报文;
  • 处理请求——对请求报文进行解析;
  • 访问资源——访问报文中指定的资源;
  • 构建响应——创建带有正确首部的 http 响应报文;
  • 发送响应——将响应回送给客户端;

什么是 http 报文?

  • http 报文是符合 http 协议的文本数据块;

  • 2 种类型:请求报文和响应报文;

  • 请求/响应报文由以下内容组成:

    • 请求行 或状态码行
    • 头字段
    • 空行
    • 可选的报文主体数据

请求行中的方法字段:

http 协议定义了客户端和服务器之间交互的消息内容和步骤,其基本思路非常简单。

首先,客户端会向服务器发送请求消息请求消息中包含的内容是 "对什么" 和 "进行怎样的操作" 两个部分。

其中 "对什么" 的部分就是 URI (Uniform Resource Identifier,统一资源标识符),一般就是网页或者文件或者程序等,而 "进行怎样的操作" 的部分称为方法,包括:

点击查看大图

3.2 Tinyhttpd 的内部实现

分解 httpd.c:

void accept_request(void *arg) 
void bad_request(int client) 
void cat(int client, FILE *resource) 
void cannot_execute(int client) 
void error_die(const char *sc) 
void execute_cgi(int client, const char *path, 
int get_line(int sock, char *buf, int size) 
void headers(int client, const char *filename) 
void not_found(int client) 
void serve_file(int client, const char *filename) 
int startup(u_short *port) 
void unimplemented(int client) 
int main(void

就13 个 函数,和一些宏定义,就没有其他内容了。

程序入口:main()

int main(void)
{
    int client_sock = -1;
    pthread_t newthread;

    // 1. 创建 socket,并且等待连接
    int server_sock = startup(&port);

    while (1) {
        // 2. 接受连接
        client_sock = accept();

        // 3. 创建处理线程
        pthread_create(&newthread , 
            NULL
            (void *)accept_request, 
            ...)
    }
}

创建 socket: startup()

int startup(u_short *port)
{
    struct sockaddr_in name;

    // 1. 创建 webserver 端的 socket
    httpd = socket(PF_INET, SOCK_STREAM, 0);

    // 2. 初始化 webserver 的 ip 地址
    name.sin_family = AF_INET;
    name.sin_port = htons(*port);
    name.sin_addr.s_addr = htonl(INADDR_ANY);

    // 3. 绑定 webserver 的socket 和 ip 地址
    bind(httpd, (struct sockaddr *)&name, ...);

    // 4. 开始监听
    listen(httpd, 5);
}

没什么特别的,就是典型 tcp server 编程:

解析 http 请求报文:accept_request()

这里将会完成 web server 最核心的工作:

  • 读取/解析 http 请求报文,构建响应报文。
void accept_request(void *arg)
{
    // 1. 提取第一行数据
    numchars = get_line(client, buf, sizeof(buf));

    // 2. 从第一行数据中提取出 http 方法

    // 3. 处理 POST 方法

    // 4. 处理 GET 方法
    if (strcasecmp(method, "GET") == 0) {
        // 4.1 提取 URI
        while (...)
            query_string++;
    }

    // 5. 构建并发送 http 响应报文给客户端
    serve_file(client, path);
}

构建并发送 http 响应报文给客户端:serve_file()

void serve_file(int client, const char *filename)
{
    // 1. 打开 URI 指定的资源
    FILE *resource = fopen(filename, "r");

    // 2. 发送 响应报文的 header: HTTP/1.0 200 OK...
    headers(client, filename);

    // 3. 读取并发送资源给 客户端: fgets() ---> send()
    cat(client, resource);
}

到此,Tinyhttpd的核心实现就分析完了,更多的细节,请各位自行阅读源码吧~~~

4. 相关参考

  • http 权威指南 / 第1~5章

  • Unix 网络编程 / 第1~5章

  • 网络是怎么连接的 / 第1、2、6章

  • 深入理解 Nginx 模块;

  • Lighttpd Documentation (https://redmine.lighttpd.net/projects/lighttpd/wiki/docs)

三、思考技术,也思考人生

要学习技术,更要学习如何生活。

你和我各有一个苹果,如果我们交换苹果的话,我们还是只有一个苹果。但当你和我各有一个想法,我们交换想法的话,我们就都有两个想法了。