vlambda博客
学习文章列表

利用Nginx request_id对用户行为追踪

问题背景:业务侧可能遇到过这样一个问题,通过MySQL SlowLog拿到某个慢查询的SQL,但是却很难找到对应的业务代码的出处(当然SQL本身具有特殊识别性或是对业务系统非常熟悉除外),如果SQL特征在系统中辨识度不高或者多处都存在,找起来着实很痛苦,亲测是这样。


针对上述出现的问题,Nginx request_id可以完美解决


$request_id

unique request identifier generated from 16 random bytes, in hexadecimal (1.11.0)


nginx 从1.11 之后支持生成request_id,request_id是以16进制表示,由16个随机字节生成的唯一请求标识符。通过$request_id传递,可以将接入层、web层、底层sql串起来,通过request_id能够跟踪每次请求的路由。


Talk is cheap, show me the code:


1. nginx 接入层的关键配置:

map $http_x_log_request_id $log_request_id { default $http_x_log_request_id; - $request_id; "" $request_id;}
location ~ .*\.(php|php5)?$ { fastcgi_pass 127.0.0.1:9000; fastcgi_index index.php; fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name; fastcgi_param LOG_REQUEST_ID $log_request_id; include fastcgi_params; fastcgi_intercept_errors on; error_page 500 502 503 504 /50x_php.html;}

2. 业务层Web框架入口设置全局变量:

$GLOBALS['LOG_REQUEST_ID'] = !empty($_SERVER['LOG_REQUEST_ID']) ? $_SERVER['LOG_REQUEST_ID'] : $_SERVER['REQUEST_TIME_FLOAT'];

3. 业务日志收集到文件:

<?php....$trace_log['controller'] = controller值$trace_log['action'] = action值$trace_log['url'] = 当前请求的url, 可以用$_SERVER['REQUEST_URI']获取;$trace_log['reference'] = //reference, 可以从$_SERVER获取;$trace_log['user_agent'] = user_agent值,可以从$_SERVER获取;$trace_log['ip'] = ip获取函数$trace_log['http_status'] = http状态码,可以从$_SERVER获取;$trace_log['log_request_id'] = isset($GLOBAL['LOG_REQUEST_ID']) ? isset($GLOBAL['LOG_REQUEST_ID']) : '';write_log_to_file(json_encode($trace_log));....

4. 文件->ELK

5. 框架底层SQL执行:

$comment_trace_id = '';if(isset($GLOBALS['LOG_REQUEST_ID']) && !empty($GLOBALS['LOG_REQUEST_ID'])) { $comment_trace_id= '/*trace_id_' . $GLOBALS['LOG_REQUEST_ID'] . '*/';}$sql = $sql . $comment_trace_id;  //sql 尾接request_id$this->_result = $this->execute($sql);//这样底层的慢日志sql 就会带上request_id

这里在执行的SQL语句后面接上/*request_id*/,并不影响SQL本身的执行,与此同时还能知道SQL的出处(与请求关联)。


根据上述步骤下来,就可以定位出一个SQL的来源于哪个请求,并且可以知道这个请求是由哪个账号或是用户产生的,以及产生时间等等等等。是不是很帅?