某摄像头协议分析

环境

主机：win10
手机：Pixel 4 ，Android 10
APP版本：V4.70.0

工具

IDA、JADX、Frida、Charles、WireShark、x64dbg

逆向思路

总结：抓包 -> 分析数据包特征 -> 确定UDP/TCP -> HOOK 发包函数 -> 分析代码 -> 验证

流量抓包分析

经过抓取APP与摄像头之间通信的流量，发现以下几种固定特征流量。

magic: 3acf872a

经过反复抓包，发现同一个包有以下特征：

3a cf 87 2a 00 01 00 00 01 00 00 00

这12个字节固定不变，后面的数据在变。

不同包，同样的magic，对比后发现原先12个字节的中间四字节会变化。

如下：

同一个包的client和server包，对比后发现原先12个字节的中间四字节也会变化，其他部分相似度很高。如下：

最终发现，整个数据长度为0x11c,中间四字节为0x00000100,那么我们可以得出真实数据为magic往后20字节，其他字节含义未知。
magic: 20cf872a

这个数据包比较简单，整体固定不变，可能保活心跳之类的数据包。
magic: 10cf872a

通过对比，也可以发现前16个字节后的四字节为数据长度，而这个包数据似乎里面还嵌套这另外的数据结构。

三种特征数据都是通过UDP传输，接下来的思路就是Hook libc.so 的sendto函数，打印调用堆栈。

查壳、脱壳

未查到，那就先将APK拖进JADX里进行分析。

Frida Hook

撸起袖子就准备直接开干，Frida Server已启动，直接运行，HOOK libc.so的sendto函数，并打印堆栈。

加解密流程分析

经过回溯信息来看，相关函数都在libp2pc.so里面。这时候可以确定的是magic: 20cf872a为ACK,使用IDA打开该so，打开p2p_send_msg_by_udp函数，发现里面并没有加密相关函数，最终追溯追到下面这个函数就戛然而止了！！！

进入p2p_udt_send_msg函数中，也没有发现相关加解密函数，全部都在取数据，然后发送。

分析发现，所有操作基于多线程。到这断了思路。

代码翻来翻去，注意到了这个p2p_log函数，既然静态分析不行，那就看看log日志，了解整个流程，HOOK p2p_log函数后打印已知字符串，就可以得到一大堆log。

经过观察，字符串最前的应该是函数名，那么去p2p_conn_get_timer_retry函数看看。

里面也没啥重要函数，在看看p2p_make_c2m_q函数。

到这里，基本上有点头绪了，点进p2p_make_cmd函数看看。

最终找到了主体函数p2p_enc_cmd，在这个函数里面，进行了参数组装。

gP2P_pCmdTable里面是字符串表，如下：

里面字符大概有C2D_S、C2M_Q之类的

gP2P_pParaTable也是字符串表，如下：

里面字符大概有uid、sid之类的

数据结构上是一个xml结构，大概是下面这种：

\n<C2M_Q>....</C2M_Q>\n

通过交叉引用，发现了加解密的地方。

magic: `3acf872a`数据

通过HOOK p2p_encrypt_and_decrypt和p2p_calc_crc函数后，发现这里就是magic: 3acf872a数据组装和加密的地方，至此该数据包结构解清晰了。

magic	data size	unknown	transmission id	checksum	payload
3a cf 87 2a	44 01 00 00	00 00 00 00	a4 0c 3d 00	95 49 09 56	d3.....

4 Bytes magic: 3a cf 87 2a
4 Bytes data size: 加解密数据长度
4 Bytes unknown: 固定字节，含义未知
4 Bytes Transmission ID: 加解密所需的key
4 Bytes Checksum: 加密后数据的CRC32校验值
n Bytes Payload: 加解密数据

数据包结构清晰了，现在就要还原加解密算法了，在IDA里查看p2p_encrypt_and_decrypt伪码。

看起来就是简单的xor操作，但这里面有些函数比较陌生，比如

v9.n128_u64[0] = 0x5A6C7F8D1F2D3C4BLL;
v9.n128_u64[1] = 0x8271635A38172E4BLL;
v10.n128_u64[0] = 0xA5C6F7D8863F1A2BLL;
v10.n128_u64[1] = 0x17F2D3A58371E1B4LL;v3 = vdupq_n_s32(a3);
v9.n128_u64[0] = 0x5A6C7F8D1F2D3C4BLL;
v9.n128_u64[1] = 0x8271635A38172E4BLL;
v10.n128_u64[0] = 0xA5C6F7D8863F1A2BLL;
v10.n128_u64[1] = 0x17F2D3A58371E1B4LL;
v4 = vaddq_s32(v9, v3);

于是去问了一下Google，这种是ARM NENO指令集，一种基于SIMD**的ARM技术，NEON结合了64-bit和128-bit的SIMD指令集，提供128-bit宽的向量运算(vector operations)。有兴趣的看下这篇文章NEON简介及基本架构，这里就不多赘述了。

那么接下来，就该祭出大杀器-ex咖喱棒了

以下是chatgpt的回答：

vdupq_n_s32(a3)：将 a3 的值复制到一个 128 位向量中的每个元素，生成一个包含相同值的向量 v3。
v9 和 v10 是两个 128 位向量变量，初始化为指定的常数值，通过 .n128_u64[0] 和 .n128_u64[1] 分别访问向量的第一个和第二个 64 位整数成员。
vaddq_s32(v9, v3)：将向量 v9 和向量 v3 中的对应元素相加，生成一个新的向量 v4。
a2 + 6 和 a2 + 3 是用于确定循环次数的值。根据这些值，计算出需要处理的向量元素个数 v7。
进入循环，使用 NEON 指令进行加密和解密操作。*(_DWORD *)&a1[4 * v6] 是对字符数组 a1 的访问，v9.n128_u32[v6 & 7] 是对向量 v9 的访问。^= 操作符表示按位异或运算，将结果存储回字符数组 a1 中。
循环结束后，将字符数组 a1 的第 a2 个元素设置为 0。

通过HOOK p2p_encrypt_and_decrypt函数可知，a1为加解密原数据，a2为数据长度，a3为加解密所需的key。

我们逐句翻译IDA伪码，使用Python复现。

v3 = vdupq_n_s32(a3);

将a3转换成4个short32的值并赋值给128 位向量变量V3。我们使用numpy库去实现。

v3 = np.full(4, a3, dtype=np.int32)

v9.n128_u64[0] = 0x5A6C7F8D1F2D3C4BLL;
v9.n128_u64[1] = 0x8271635A38172E4BLL;
v10.n128_u64[0] = 0xA5C6F7D8863F1A2BLL;
v10.n128_u64[1] = 0x17F2D3A58371E1B4LL;

.n128_u64[0]代表128位的前64位，.n128_u64[1]代表128位的后64位，而v9为4个int32的数组。根据高低位再把128位分为4个32位整数即可。小端计算。

v9 = [0x1F2D3C4B, 0x5A6C7F8D, 0x38172E4B, 0x8271635A]

v10同理。

v10 = [0x863F1A2B, 0xA5C6F7D8, 0x8371E1B4, 0x17F2D3A5]

vaddq_s32(v9, v3)，v9 和v3 中的对应元素相加，short32类型保存。Python中使用lambda表达式实现相加，并转化为list数组。

v4 = list(map(lambda x, y: x + y, v3, v9))

v10同理。

v10 = list(map(lambda x, y: x + y, v10, v3))

其他就是正常翻译就行了。完整代码如下：

def p2p_decrypt(a1, a2, a3):
    # 计算填充的字节数
    padding_bytes = (4 - (a2 % 4)) % 4
    # 添加填充字节
    a1 += b'\x00' * padding_bytes
    # 将a1字节数组转换为四字节整数的列表
    enc_data = list(struct.unpack(f"<{len(a1) // 4}I", a1))
    # 将a3字节数组转换为四字节整数的列表
    v3 = np.full(4, a3, dtype=np.int32)
    print("解密key四字节整数的列表: ", v3)
    # 小端计算
    # v9 = [0x8271635A, 0x38172E4B, 0x5A6C7F8D, 0x1F2D3C4B]
    v9 = [0x1F2D3C4B, 0x5A6C7F8D, 0x38172E4B, 0x8271635A]
    # v10 = [0x17F2D3A5, 0x8371E1B4, 0xA5C6F7D8, 0x863F1A2B]
    v10 = [0x863F1A2B, 0xA5C6F7D8, 0x8371E1B4, 0x17F2D3A5]
    # 将v3和v9整数列表里的整数一一对应相加
    v4 = list(map(lambda x, y: x + y, v3, v9))
    # print(v4)
    v7 = len(a1) >> 2
    print("解密数据循环次数: ", v7)
    # 将v3和v10整数列表里的整数一一对应相加
    v10 = list(map(lambda x, y: x + y, v10, v3))
    # 将v4和v10整数列表里的整数一一对应相加
    v9 = v4 + v10
    if v7 > 0:
        for v6 in range(v7):
            # print(hex(a1[v6]), hex(v9[v6 & 7]))
            # 将加密数据整数列表里的整数与v9整数列表里的整数进行异或
            enc_data[v6] ^= v9[v6 & 7]
    # a1[a2] = 0
    # 转换为小端存储的十六进制字符串
    hex_string = ''.join([struct.pack('<I', num).hex() for num in enc_data])
    hex_string_len = len(bytes.fromhex(hex_string))
    if padding_bytes > 0:
        hex_string = bytes.fromhex(hex_string)[:hex_string_len - padding_bytes]
        print("解密数据异或后16进制数据: ", hex_string)
        return hex_string
    else:
        hex_string = bytes.fromhex(hex_string)
        print("解密数据异或后16进制数据: ", hex_string)
        return hex_string

至此，magic: 3acf872a数据的解密接完成了。

接下来我们看另外一个数据，magic: 10cf872a。

上面提到该数据包含两种数据结构，经过观察研究发现，一种是加密数据，一种是明文音视频数据。

magic: `f0debc0a`数据

加密数据

具体形式如下：

可以看出大体结构为10 CF 87 2A ......F0 DE BC 0A。经过和其他包对比发现DF 00 00 00 和CB 00 00 00为数据长度，其他字段未知。

Frida大法暂时失效了，无法应对多线程，打印堆栈只有一些不痛不痒的东西。

索性开辟新天地，盯上了它的PC版本。

打开软件，使用x64dbg附加，由于我们只关注同时包含10 CF 87 2A和F0 DE BC 0A的数据，因此可以在recvfrom函数上下条件断点，条件即buf = F0 DE BC 0A，设置如下：

最终堆栈情况如下：

使用IDA加载该dll，并跳转到0F69872D这个地址。为了方便x64dbg与IDA之间跳转，我们先将IDA的基址改为x64dbg里面的。反编译0F69872D，得到伪码如下：

经过分析发现，会进入sub_F697CC0这个函数，在跟进去看看。

反编译该函数代码后往下翻一翻就看到了比较关键的代码，如下：

根据sub_F772AF0函数打印的结果和原报文数据对比可知magic: 10cf872a的数据结构大体如下：

magic	connection id	unknown	packet id	packet size	payload
10 cf 87 2a	79 15 00 00	00 00 00 00	00 00 00 01	01 dc 00 00	14.....

4 Bytes magic: 10 cf 87 2a
4 Bytes Connection ID: UDP 连接ID
4 Bytes unknown: 固定为00000000
4 Bytes Packet ID: 包序
4 Bytes Payload Size: 数据大小
n Bytes Payload: 加密数据

到这本想投机取巧一下，大胆猜测是同一种加解密方法，于是就用magic: 3acf872a数据的解密方法，拿Connection ID当作key尝试解密了一下，结果失败了。

到这只能继续分析找出该数据块的解密方法。

本想跟上一个数据一样通过字符串去定位，最终失败。只能通过调试去慢慢寻找，多线程操作，跳来跳去，真的掉头发哦。

x64dbg这块玩的并不是很熟，所以并不知道如何快速在调用堆栈中找到相关线程，有大佬知道的话，烦请指导一二，不甚感激！！！！

查了查Google也没找到技巧，那就只能铁杵磨成针，一个一个的拿着地址去IDA里面看。最后发现了一个线程里的函数代码非常的像。

反编译伪码如下：

我们在函数头和循环异或这里打个断点看一下。运行程序，断在函数头。

可以看到eax里的值即为去掉第一个数据结构（10 cf 87 2a）后的数据。再次F9断下刚刚循环异或的地方。

mov     edx, [ebp+10h]
mov     ecx, edx
sub     ecx, esi
lea     eax, [esi+ecx]
and     eax, 7

计算byte_F942224的index。

lea     esi, [esi+1]
mov     al, byte_F942224[eax]
xor     al, dl
xor     [esi-1], al
sub     edi, 1

esi地址存储的为加密数据，每次取一个字节与byte_F942224数组里的一字节异或。

将其翻译为Python代码如下：

def xml_decrypt(ba, offset):
    key = bytearray([0x1f, 0x2d, 0x3c, 0x4b, 0x5a, 0x69, 0x78, 0xff])
    e = bytearray(len(ba))
    for i in range(len(ba)):
        xor_result = operator.xor(offset & 0xFF, operator.xor(ba[i], key[(i + offset) % 8]))
        e[i] = xor_result
    print(e.decode('utf-8'))
    return e

magic：f0debc0a数据的加密方式就分析完了。通过上述代码分析，可得该数据结构大体为以下几种：

magic	message id	message length	encryption offset	encrypt	message class	payload
f0 de bc 0a	01 00 00 00	2c 07 00 00	00 00 00 01	01 dc	14 65	2d.....

4 Bytes magic: f0 de bc 0a
4 Bytes Message ID: 消息ID
4 Bytes Message Length: 消息体长度
4 Bytes Encryption Offset: 加密key
2 Bytes Encryption flag: 加密标志
2 Bytes Message class: 消息类型
n Bytes Payload: 加密数据

Magic	Message ID	Message Length	Encryption Offset	Status Code	Message Class	payload
f0 de bc 0a	01 00 00 00	28 01 00 00	00 00 00 01	c8 00	14 64	3b....

4 Bytes magic: f0 de bc 0a
4 Bytes Message ID: 消息ID
4 Bytes Message Length: 消息体长度
4 Bytes Encryption Offset: 加密key
2 bytes Status Code:消息状态码
2 bytes Message class:消息类型
n bytes Payload:加密数据

音视频数据

音视频magic如下：

I Frame: 0x30, 0x30, 0x64, 0x63
P Frame: 0x30, 0x31, 0x64, 0x63
AAC: 0x30, 0x35, 0x77, 0x62

视频数据内容如下：

还是经典的10 cf 87 2a结构，去除这个结构后就是视频数据结构了。结构大体如下：

4 Bytes I_frame_magic/P_frame_magic:视频I/P帧magic
4 Bytes video_type:视频类型-H264/H265
4 Bytes video_len:视频数据长度
4 Bytes channel:NVR 频道号
4 Bytes microseconds:NVR的时间戳精度
4 Bytes unknown:固定字节
4 Bytes utc_time:UTC时间
4 Bytes unknown:固定字节
n Bytes video_data:视频数据

音频数据内容如下：

头部数据相同，这里不再赘述，直接看音频数据部分。

4 Bytes audio_magic:音频数据magic
2 Bytes audio_len:音频数据长度
2 Bytes audio_len:音频数据长度

到这里有关该摄像头的所有流量就分析完成了。

xiaokanghub/heolink