用python可视化protobuf内容

vlambda
2021-05-17

用python可视化protobuf内容

一、什么是protobuf

Protocol Buffers（简称protobuf）是一种轻便高效的结构化数据存储格式，可以用于结构化数据串行化，或者说序列化。它很适合做数据存储或 RPC 数据交换格式，用于通讯协议、数据存储等领域的语言无关、平台无关、可扩展的序列化结构数据格式。目前提供了 C++、Java、Python 三种语言的 API。

二、protobuf的优缺点

(1) 优点：
protobuf以高效的二进制方式存储，比XML小3到10倍，快20到100倍。
平台无关、语言无关
二进制、数据字描述
提供了完整详细的操作API
(2)缺点：
可读性差：为了提高性能，Protobuf采用了二进制格式进行编码。
对于开发同学来说，在进行程序调试时，二进制格式编码阅读比较困难。
对于测试同学来说，查看请求或者响应中的特定编码格式的protobuf数据比较困难，无法直观看到数据。

三、python如何解析

小编在测试过程中接触到的protobuf文件中以url_16_le格式编码较多，故以此编码为例进行处理，借助python的codecs库可以处理此类编码，当然codecs库中还有其他编码（utf_32_le、utf_32_be、utf_16_be、utf_7、utf_8），感兴趣的小伙伴可以去了解下。

1、命令行中实现解析

2、代码中实现解析

例：解析该protobuf文件（其中2代表url_16_le编码格式的数据）
8 {
1 {
6: 117
}
2: “\311Q\256v”
5: 1
6: 1
}

(1) 取出url_16_le编码格式的内容，并重新转为byte类型

l2 = str(line).split('"')[1].replace('\\\\','\\')
l3 =bytes(l2,encoding="utf8")

l3输出结果为==>b’\311Q\256v’

(2) 数据处理（如图所示，l3输出结果解析后乱码，故需要进一步处理：\n\t\r禁止转义）

用python可视化protobuf内容

l4 =codecs.escape_decode(l3, 'hex-escape')[0]

l4输出结果为==>b’\xc9Q\xaev’（如图，处理后的数据就可以解析了哦）

用python可视化protobuf内容

(3) 数据解码

l5=codecs.utf_16_le_decode(l4)[0]

l5输出结果为==>凉皮（将结果输出到某个文件就可以直观查看数据了哦）
(4) 代码总览

(5) 输出结果示例

四、小结

本文主要简单介绍了protobuf的概念及如何使用python得到可视化的数据。脚本虽简单，但在测试过程中针对每一个请求及响应，基本上都能直观的看到protobuf的数据，大大的提高了测试效率。同学们是否还有其他的可视化的方法，欢迎大家来补充~~

vlambda博客
学习文章列表

用python可视化protobuf内容

标签:

推荐阅读

相关文章

vlambda博客 学习文章列表

用python可视化protobuf内容

标签:

推荐阅读

相关文章

vlambda博客
学习文章列表