利用Nginx request_id对用户行为追踪
问题背景:业务侧可能遇到过这样一个问题,通过MySQL SlowLog拿到某个慢查询的SQL,但是却很难找到对应的业务代码的出处(当然SQL本身具有特殊识别性或是对业务系统非常熟悉除外),如果SQL特征在系统中辨识度不高或者多处都存在,找起来着实很痛苦,亲测是这样。
针对上述出现的问题,Nginx request_id可以完美解决
$request_id
unique request identifier generated from 16 random bytes, in hexadecimal (1.11.0)
nginx 从1.11 之后支持生成request_id,request_id是以16进制表示,由16个随机字节生成的唯一请求标识符。通过$request_id传递,可以将接入层、web层、底层sql串起来,通过request_id能够跟踪每次请求的路由。
Talk is cheap, show me the code:
1. nginx 接入层的关键配置:
map $http_x_log_request_id $log_request_id {
default $http_x_log_request_id;
- $request_id;
"" $request_id;
}
location ~ .*\.(php|php5)?$ {
fastcgi_pass 127.0.0.1:9000;
fastcgi_index index.php;
fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name;
fastcgi_param LOG_REQUEST_ID $log_request_id;
include fastcgi_params;
fastcgi_intercept_errors on;
error_page 500 502 503 504 /50x_php.html;
}
2. 业务层Web框架入口设置全局变量:
$GLOBALS['LOG_REQUEST_ID'] = !empty($_SERVER['LOG_REQUEST_ID']) ? $_SERVER['LOG_REQUEST_ID'] : $_SERVER['REQUEST_TIME_FLOAT'];
3. 业务日志收集到文件:
<?php
....
'controller'] = controller值 trace_log[
'action'] = action值 trace_log[
'url'] = 当前请求的url, 可以用$_SERVER['REQUEST_URI']获取; trace_log[
'reference'] = //reference, 可以从$_SERVER获取; trace_log[
'user_agent'] = user_agent值,可以从$_SERVER获取; trace_log[
'ip'] = ip获取函数 trace_log[
'http_status'] = http状态码,可以从$_SERVER获取; trace_log[
'log_request_id'] = isset($GLOBAL['LOG_REQUEST_ID']) ? isset($GLOBAL['LOG_REQUEST_ID']) : ''; trace_log[
trace_log));
....
4. 文件->ELK
5. 框架底层SQL执行:
$comment_trace_id = '';
if(isset($GLOBALS['LOG_REQUEST_ID']) && !empty($GLOBALS['LOG_REQUEST_ID'])) {
$comment_trace_id= '/*trace_id_' . $GLOBALS['LOG_REQUEST_ID'] . '*/';
}
$sql = $sql . $comment_trace_id; //sql 尾接request_id
$this->_result = $this->execute($sql);
//这样底层的慢日志sql 就会带上request_id
这里在执行的SQL语句后面接上/*request_id*/,并不影响SQL本身的执行,与此同时还能知道SQL的出处(与请求关联)。
根据上述步骤下来,就可以定位出一个SQL的来源于哪个请求,并且可以知道这个请求是由哪个账号或是用户产生的,以及产生时间等等等等。是不是很帅?