这里将定期记录着一些与
Sakura
师傅以及一群小伙伴共同学习的内容与进度。
主要任务:STL
- 第1周(2020.5.18-2020.5.23):学习基础的概念,例如traits之类的
- 第2周(2020.5.23-2020.5.29):数据结构抄到list
主要任务:编译原理
- 第3周(2020.5.29-2020.6.05):词法分析与语法分析
- 第4周(2020.6.05-2020.6.14):逆向CS143提供的标准语义分析器
- 第5周(2020.6.14-2020.6.21):抄PA5目标代码生成,研究了一下flex和bison
- 第6周(2020.6.21-2020.6.28):整了一份Compiler总结,恶补Makefile、完成LLVM IR PASS assignment1
主要任务:LLVM IR Pass 代码优化
- 第7周(2020.6.28-2020.7.05):完成LLVM IR Pass的所有三个Assignment,看了点GC的算法篇
- 第8周(2020.7.05-2020.7.12):大一暑期实训(1/2周)
主要任务:AFL_LLVM_mode源码分析
主要任务:CSAPP
- 第10周(2020.7.19-2020.7.26):CSAPP LAB做到第五个Lab-Cache Lab
- 第11周(2020.7.26-2020.8.02):完成CSAPP全部Lab
主要任务:uCore Lab (第15-18周期末复习)
- 第12周(2020.8.02-2020.8.09):完成Ucore-Lab1,正在研究Lab2
- 第13周(2020.8.09-2020.8.16),完成uCore-lab2 lab3
- 第14周(2020.8.16-2020.8.23):信安国赛 + 朗诵比赛准备。完成Lab4和Lab5(除了Challenge)。Lab5 Challenge的写时复制代码已经完成。
- 第15-18周(2020.8.23-2020.9.20):大一下期末复习 + 期末考
- 第19周(2020.9.20-2020.9.27):uCore完成Lab6、Lab7,uCore-Lab8视频刚开始看,笔记还没来得及做
从第20周开始,所有涉及的资料以及分析等等均在个人博客上发布。
- uCore-Lab8 终于结束,PlaidCTF2020 Mojo还在挣扎,看了点调试器的文章
- Mojo完成,CVE-2019-5826在看blackhat稿子
- CVE-2019-5826 POC分析完成, CVE-2020-6549 render UAF 才看一点点
- 完成 CVE-2020-6549 render UAF的POC分析,完善当前study list,以及阅读了一下C++ case,了解chrome的一些基本结构与方法。
- 完成CVE-2020-6541分析
- 10.27:看了一点CVE-2020-6541的内容,尝试追溯其调用链
- 10.28:该漏洞研究完成,笔记已上传
- 10.29:下拉V8代码并编译(代理设置搞了半天才好)
- 10.30:忙学校的事情
- 10.31:忙评奖的事情
- 11.01:打湖湘杯
JSPromise type confusion学习
- 11.02:装了一下issue1784的调试环境
- 11.03:阅读了一个下午的issue1784,发现装环境的方向错了,再装了一个chrome release
- 11.04:仔细审计v8源码,终于理解JS的type confusion
- 11.05:上课
- 11.06:尝试找到blink-in-js调试方式,无果
- 11.07:审计一天,遇到了相当多的问题,暂时无法解决。不过基本上已经了解大部分关于Promise的内容,达到了目的,可以开始下一步的学习。
- 11.08:肝课程作业
CodeQL学习、寒假实习面试
- 11.09:CodeQL配置环境
- 11.10:大二寒假实习面试
- 11.10:CodeQL重新配置环境
- 11.11:完成Chromium下载链接爬虫
- 11.12:阅读CodeQL脚本
- 11.13:阅读CodeQL doc,了解其基本语法
- 11.14-11.15:完成日常课程作业
试用了一段时间,发现日报模式可能不太适合我,因此切回周报模式。
- 下拉chromium 24gb的源码、期中复习(1/2)
- 期中复习(2/2)
- 完成学校4份实验+6份报告
- CodeQL完成所有基础语法的学习
- 编写了检测V8callback的ql来练手
- CodeQL编写了DispatchEvent的QL,仍然存在一些问题
- 完成学校5份实验7份报告
- 看了几个github securityLab关于CodeQL的几个例子,写了篇博客
- 同时还完善了扫描DispatchEvent的QL代码
- 学习GoogleCTF2018(Final) Just-In-Time,刚配置好环境
- 期末复习+考试
- 完成V8 turboFan的学习。
- 静态编译器研发实习(关于静态指针分析方向 之 FlowSensitive,以及学习构建控制依赖图算法 CDG)
- 完成CVE-2021-3156 sudo 提权漏洞的简单分析。
- 了解了点 V8 的 Gabage Collection
- 学习 V8 历史漏洞
- CVE-2019-13764 TypeInductionVariablePhi in v8 JIT分析
- V8 CVE-2019-5755 MinusZero类型缺失漏洞 in turboFan
- 分析了 CVE-2018-16065 in V8 EmitBigTypedArrayElementStore
- 做了个针对 BurpSuite v2.0 beta 的 exploit
- 做了个针对 BurpSuite pro v2020.2 的内置 chromium 的 exploit(由于开启沙箱因此最终无法利用),学习了一下 v8 指针压缩的漏洞利用
- 学习 IDAPython 插件的编写,学习 ida 指令回溯的算法实现,完善firmeye 插件在 x86 架构下的实现。
- 学习 IDAPython 插件的编写,完成Analysis以及输出部分,更加便于使用。
- 了解整数溢出相关的漏洞模式
- 阅读代码审计、程序结构的一些特点
- 面试腾讯玄武实验室 生态组 客户端安全
- 阅读了一部分 WebServer 的源码,学习其中的开发技巧
接下来3-5周有点摸,主要是学校课业压力有点大,时间太碎片化了。。。
最主要还是完成学校 N 份报告 + 调研 + 视频作业 + 期中考试复习(都是时间吞噬者)。。。
- WebServer 源码又看了一部分,主要把 base 里面多线程相关的内容理解了一下
- 学习了一点点关于 V8 Concat 的漏洞,这两天得再调试一下。
- 简单了解了一下推特上那个 chrome 0.5 day 的漏洞,关于 v8 backend。
- 完成所有面试,腾讯玄武实验室-生态安全组-客户端安全,offer到手。
-
HNU算法设计课程复习 + 算法设计期中考试 + 课程报告(1/2)
-
学习某某软件(for android) 的 n day exploit 利用
编译 v8 for debug 时只去除 abort in
V8_Fatal
会有坑,DCHECK没去除干净,会引发 SIGSEV T_T。。。 -
试着对某些漏洞补丁,通过 Regress / POC 来构造 exp。
不过大多数都构造不出来 T_T,在原地踏步。正所谓看答案一看就懂,做题一做就废。
时间还是太短,积累的还是不够。
-
技术提升遇到瓶颈。与教练聊了一下,明确了自己当前存在的问题,对接下来学习的重点有了一点大概的方向。
问题:钻的不够深、探的不够广,时间不太充裕,且学校课程/活动使可用时间进一步碎片化。
-
买了一本《计算机网络》,准备先开坑用 C++ 实现一个自己的 WebServer。只读别人的代码没有什么收获,还是边写边学效果会更好一点。
WebServer 这个任务将长期进行下去,打持久战 QwQ.
- 目前 WebServer 实现了互斥锁和条件变量的封装
- 实现了简单的 线程池机制
这周干的比较杂,主要是因为时间太碎片化了。
-
WebServer 部分
- 主要完成了基本多线程进行监听套接字的分发,以及完成 read/write 函数的包装,使其支持部分异常处理。
- 阅读Linux manual 学习各类 socket 函数的用法,将上述内容使用 md 记录了笔记.
-
研究了一下 WSL 如何支持 i386 架构程序的运行,并水了一篇博客。
-
研究 JS 引擎 v8 的 IR 图各个符号的用途。
-
上课摸鱼水《计算机网络》,看了大概几十页。
-
帮一个学长写了个脚本,用以判断特定域名是 A 类型还是CNAME类型,同时判断该域名是否已过期。
- 计算机网络,学习了应用层一章,熟悉了HTTP报文格式,以及运输层 UDP 相关内容。
- 计算机网络
抄了点写了点笔记。 - 基本完成 WebServer-1.0版本,已经可以对 HTTP 报文实现基础的处理和返回数据。剩余一些细节仍然需要琢磨一下。
- 传了一下 WebServer-1.0版本的笔记,这份笔记仍然需要随着代码精雕细琢一下。
期中考试周结束,接下来的时间或许可以多一点点。
-
计算机网络,学习到第四章网络层 IPv4部分。前三章
文摘笔记已上传至blog。上课摸鱼学计网,下课回去整笔记。计网笔记整理相当相当耗时间,可能是因为内容实在太多太细了。
计网目前已经看完了大约45%,预计一个月内可以粗略看完(即选择性忽略一些目前用不到的内容)并且整理完所有笔记,预计。XD
Wireshark实验还没做,这个可以以后慢慢来。
-
WebServer-1.0版本完结(CommitID:6473f5 - github)。1.0版本的
技术文档笔记已上传至blog. -
epoll 多并发
- 把 epoll 模型以及三个相关函数细致的了解了一下,写了点笔记
- 看了几个使用 epoll 的例子
- WebServer中实现了 epoll 函数相关的封装,接下来是使用。
争取在接下来一周内,完成 epoll 相关多并发的学习,整一个 WebServer-1.1 & 笔记出来,尽量结束掉网络编程该部分的学习,开始整新花样。
这周一直在肝 WebServer-1.1。WebServer-1.1 在原先 1.0 版本的基础上大量重构了代码,相对于旧版本来说,新版本主要更新了以下内容:
- 替换并发方式,从多线程并发 更换为 epoll 并发
- HTTP报文处理添加 POST 和 HEAD 方式的处理
- 支持自定义 WebServer 的 www 目录路径
- 使用 timerfd API,对每个 HTTP/1.1 Keep-Alive 的 TCP 链接设置了超时时间,超时后若还没有请求,则强制关闭该连接。
- 支持 Post 请求使用 CGI 程序。其中CGI程序可以是 shell 脚本、python脚本、ELF可执行文件等等。
- 支持自定义 www 目录路径,不再限制为当前工作目录。
- 支持更多的 Http 错误报文。
时间不太够,因此笔记还没写,还有一些bug还没修,多线程多进程调试整的人都要秃了。。。。
WebServer-1.1到目前位置还没有彻底完成,但这个任务从下周开始先暂时挂起(因为要把大块的时间留给更有意义的事情),等到了时间较为碎片的期末周再回来继续完善。
- 计算机网络 完成网络层的学习
- 合作开发 AST-Fuzz - dump & parse + 测试套件
继续开发 AST-Fuzz - print & analyze + 测试套件
AST-Fuzz - type system & analyze
AST-Fuzz - 扩展类型系统
2021.6.19-2021.6.29 HNU 期末周,复习+考试
-
HNU 期末周, 复习 && 考试
-
AST-Fuzz - 完善类型系统 + 测试套件 + 零碎 mutate
最近写了 N 多 security bug,还是太菜了,裂开......
- HNU期末周
- AST-Fuzz - AST
- many many many bugs fixed
- port to AFL
- docs
- HNU 前半段小学期(1/2)(最占时间)
- AST-Fuzz
- docs
- 模板代码生成
- 梳理类型系统
- 实现了一点其他分析
- HNU 前半段小学期(2/2)(最占时间)
- AST-Fuzz
- 继续修bug
- 修语义
- 写了很多模板
- 飞北京,准备被各位巨佬吊打
- 腾讯玄武实验室-生态安全组-客户端安全 快乐实习
- AST-fuzz
- 重构 shit mountain
- 完善 builtin
- ......
-
还是快乐实习
-
AST-fuzz v1.0 封版 50%
整了2.5个月,大火花和巨轮都聊出来了,真不容易......
接下来趁着实习期间难得可以摸到 iMac,好好学一手 MacOS。
-
快乐实习 plus
-
AST-fuzz v1.0 封版100%
起飞
- 快乐实习 plus plus
- 分析 crash,报了两个fuzz出来品相比较 lj 的洞
- 实习结束,准备返校
- HNU 夏季实训(3/4)
- 写了一些零碎的脚本
- 继续学习 fuzz,简单看了一下 IR Fuzz,同时正在学习 HITBSecConf 上的一个有趣 fuzz 议题
- 练练 pwn 题,太久没写题了,0解选手
-
HNU 夏季实训(4/4)
-
学习 Trapfuzz 的思路,理解其代码,并与教练一起搭建起一个 fuzz 环境,跑出一个 adobe 空指针漏洞。
-
修复 IR fuzz 中关于 Python 深拷贝浅拷贝的一个巨坑,该巨坑让我们丢失了一个 crash 样本(简直痛心)
Python 函数默认参数千万别是可变对象。
-
学习 TrapFuzz 中 Linux 部分相关的内容,包括 gdb 脚本以及 gdb patch 的方式。
gdb python 接口:https://sourceware.org/gdb/onlinedocs/gdb/Python.html#Python
-
对 IR fuzz 添加构造畸形 unicode 字符串功能
这里有两种方式构造畸形 unicode 字符串,一种是直接在代码中放上已经构造好的畸形unicode,但这样会使得 IR fuzz 在处理 string 时容易产生错误。
再一种就是生成诸如 '\xXX' 这样的字符。这种字符将在 JS 代码层面展示的很好,而具体的字符串将在 adobe 解析所构造的 JS 代码时动态产生 unicode 字符。
-
理了理关于 CS 架构程序的 fuzz 思路。
突然发现很久没有写博客了。以后除了研究比较大块的内容以外,其他的一点点笔记或思路就直接记录在 learn list 里。
不然一小点笔记就开一篇新博文感觉有点浪费(逃)
-
整体上分为两部分,分别是
- 生成语法和语义正确的测试用例
- 减少fuzz时的输入空间
对于第一部分,
- Favocado解析 API 信息。获取 binding code 的完整语义信息,包括但不限于方法参数与返回值类型、个数等等
- 之后在预定义的语句格式中随机选择 JS 语句格式,并利用当前的binding code 语义信息以及所维护的上下文类型信息等等进行填空,以尽量满足语法语义的正确性。
对于第二部分:根据 API 的关联性,构建不同的 binding code 以及各类 native API 之间的关联性,并划分等价类。之后的变异就基于等价类来变异,这样可以降低无关类型的输入,大幅度降低输入空间。
如果不想啃论文可以直接看看这个简约版 - 白泽带你读论文 | Favocado - 知乎
-
简单瞄了几种 hook 技术,只是看了看没写代码
inline hook 有点有趣,想找个机会研究一下,可惜最近有点忙。
-
打算看看 fuzz 的 结构感知,试着写写 CTF 菜单题的 fuzz 模板
-
接上面,使用 protobuf 搭配 AFL++ (qemu mode & QASAN)做了个简易 CTF fuzz。
因为只是抱着研究学习的目的来做它,所以实际上用起来可能会比较难用(笑)
-
报了一个 Debug 模式下才会触发的 SQLite UAF,被谷歌毙了(哭泣)。
-
简单读了读 Coming : a Tool for Mining Change Pattern Instances from Git Commits 论文。这篇论文大体上介绍了一个从 Git 仓库历史提交信息中获取指定代码模式信息的工具。
它可以:
- 遍历所有历史 commit 信息
- 分析相邻 commit 的细粒度 diff 更改
- 在这些 diff 更改中检测 change pattern instance
- 计算代码更改频率
- 将分析结果用 JSON 格式输出等等
-
在课程上花费的时间有亿点点多,而且这周状态也不太好,自我检讨一下。
-
Kernel pwn CTF 入门,配环境踩坑配了两天;同时也在阅读 Linux Device Drivers 这本书。
-
接上面,Kernel Pwn CTF 简单入了个小门,写了点记录但还没写完,还差一点 ROP 利用,先不传了。
-
这周摸了,没怎么学技术,在写一堆红色材料,写不完了......
生活就像是操作系统,总会有事情会抢占掉当前运行的进程。
-
之前报的一个 facebook OOB read vulnerability 准备发 bounty 了。 虽然不多,但毕竟是第一笔 bug bounty,感觉相当不错。
-
完善了剩下的 Kernel Pwn CTF 入门笔记 - 传送门
-
继续写红色材料......
-
简单练了几题算法题
-
阅读一个有趣的论文 FUZZIFICATION: Anti-Fuzzing Techniques
-
三方面来降低 fuzz 效率
-
speedbump:
-
首先使用给定 testcase 来识别 cold path(正常执行很少或几乎不访问的路径),并在 code path 中插入 delay 语句以较大幅度提高程序运行时间
注:大部分情况下,普通用户几乎很少会进入 cold path,但 fuzz 就是为了探测 cold path 中的 bug,因此会经常进入。
-
插入 delay 语句后与先前定义的执行开销进行对比。如果低于预定开销则继续注入 delay 语句,高于则减少注入的 delay 语句
-
抗分析:为了防止被简单的 patch 掉,这里使用 CSmith 生成动态算术运算代码,而不是常规的 sleep。
同时为了防止被 deadcode elimination 优化掉,这里还修改 CSmith 以生成具有数据依赖和原始代码依赖的代码,具体一点就是涉及到了全局变量的修改。
-
-
branchtrap:
- 根据 ROP 思维实现的代码重用,在大量函数内部插入输入敏感的跳转,显著改变执行路径,诱导基于coverage的fuzz更多关注无 bug 路径(因为发现了**“新”**路径)
- 在 cold path 里引入大量确定性分支,迅速占满 fuzz 的 coverage bitmap,使得 fuzz 大量产生 hash 冲突,影响或减缓发现新路径的过程。
-
antihybrid:
-
使用特定模板引入隐式数据流依赖,提高数据流污点分析的开销与难度
例如简单的 int 赋值操作,硬是要拿个循环跑。
-
插入大量假符号以触发符号执行中的路径爆炸
例如将 if 条件判断中的简单判断语句,替换成两个操作数进行 CRC 校验后的值的比较语句,额外引入了 CRC 校验代码,即大量假符号
-
缺点:容易被攻击者使用代码模式检测方式检测出来,因为模板是不变的
-
-
-
这里有个别人整理的总结可以简单看看(比我这里写的详细不少) - 《fuzzification》论文阅读 - CSDN
-
-
准备校级评优材料
-
将 IR-Fuzz 融合进 AFL,同时也融合进 AST-fuzz 中以提高 fuzz 质量
-
最近新报的一个漏洞被 facebook 毙了,可惜。不过最早报的那个漏洞流程快走完了,快乐。
-
重启 WebServer,几乎修复所有已知错误,并完善了连接爆满的错误处理,完善了日志输出的方式。
就差最后一个 bug 还没调通:一个多进程x多线程的条件竞争漏洞,怎么调也调不出来,有点难顶。
-
WebServer 最后一个 bug 终于调通了,并非条件竞争漏洞。
珍爱生命,请对每个创建文件描述符的地方使用 O_CLOEXEC
至此,WebServer 彻底结项。
-
阅读了 MemFix: Static Analysis-Based Repair of Memory Deallocation Errors for C 论文,感觉有之前大二寒假实习中,学习流敏感指针分析的味道了......
同时也尝试复现并跑通上面这篇论文里的所有测试与实验。
-
阅读论文 Low-Tech Steganography for Covert Operations,主要讲解了一个使用低级隐写技术(即无需任何高速计算机就可完成的隐写技术)来巧妙隐藏一些秘密文本。
这个就不写笔记了,论文很简单,读起来非常快。
-
阅读论文 AddressSanitizer: A Fast Address Sanity Checker 论文,了解了早期 Asan 技术的相关设计方式。
-
写了一个 fuzz crash 分类工具,思路是通过 ptrace 将 crash 时的栈帧 hash 成一条哈希值,相同哈希值的 crash 被分为同一类 crash(ptrace version src)
该思路源于 trapfuzz。
-
阅读 Address Sanitizer LLVM 3.1 最早期的源代码。
-
Asan 使用 8 字节映射至 1字节的粗粒度内存映射。每块虚拟内存都会对应一块 shadow memory。
8字节的粗粒度,是因为 malloc 返回地址会对齐8字节。
其中 shadow byte 上的值表示 origin memory 中前 n 个字节是可访问的。
-
Asan 会在 LLVM pass 过程的末尾,对所有的内存读写操作进行插桩,检查当前访问的内存地址所对应的 shadow byte 的值是否说明当前地址可访问。如果不可访问则直接abort。
-
对于溢出检测,asan 会在用户内存的左右两边分别加上一块大小固定的 redzone,其中 redzone 所对应的 shadow memory 将会被加毒。这样当访问到 redzone 时将触发 asan。
加毒(poison) 指的是将某块用户内存所对应的 shadow memory 标记为不可访问。
-
对于栈内存来说,它会先分配一块 原始栈大小 + (等待被 redzone 检测的变量个数 + 1) * redzone 大小的内存,然后修改那些目标变量的 alloc 指令的偏移量。(poisonStackInFunction 函数)
之后,将一些栈上的信息放入当前栈帧最左边的 redzone里。
在函数头部,插入给当前栈帧 redzone 加毒的操作;并在所有 ret 语句之前插入 redzone 解毒的操作。
对于当前函数,若当前函数执行了一些 noret 的函数(例如 exit、execve),则在执行这些 noret 函数之前,必须对其解毒,防止误报。处理 no ret call 是为了防止有不返回的函数调用导致调用后栈上的 poison 信息没有被处理。
-
但需要注意的是,asan 只会在全局变量的右边加 redzone。 (insertGlobalRedzones 函数)
同时,虽然全局变量的 redzone 的添加操作是以插桩的形式加入程序中,但全局变量的加毒解毒操作是位于 runtime 中。
-
Asan 会 hook memcpy 等内存处理或字符串处理的 lib 函数,以达到更好的效果。(InitializeAsanInterceptors 函数)
-
asan 除了检测 内存越界读写以外,它同样检测 UAF 和 use after return。
-
UAF
asan hook 掉了 malloc、free、realloc 等函数,创建了自己的内存管理机制,在分配内存时对内存解毒,在释放内存时加毒。
对于动态分配的内存,一共有三种主要状态,分别是:可分配、检疫、已分配。当某个内存块被释放时,该内存块将会被设置为检疫状态,并放置到检疫队列中。等到检疫队列数量超过阈值后,再将其中的检疫内存放回可分配内存池中。这样做的目的是为了延长某块内存从被释放到被二次分配的过程,延长检测 UAF 的窗口期。
-
use after return
在替换栈帧上原始 alloc 为新 alloc 之前,asan 会先分配一块 fake stack, 然后在替换 alloc 指令时,将其地址替换为 fake stack。这样,带有 redzone 的局部变量就会 alloc 在 fake stack 上,而不是 origin stack。
在当前函数结束时,fake stack 会被重新加毒,注意此时不会回收 fake stack。
那么 fake stack 在什么时候被回收呢?在分配 fake stack时。分配时会同步检测 fake stack 的调用栈,遍历调用栈中的每个 fake stack,判断当前 fake stack 所对应的 real_stack 地址是否大于当前的运行时栈。如果大于则说明该 fake stack 已经没有用处了,因此将会被释放。
-
-
asan 第一版存在局限性,例如不会检测到结构体成员之间内存对齐的那一小部分内存的越界,以及不会检测这种越界到另一块用户可读写内存中的情况等等,不过总体上实现效果非常优秀。
这里感谢 sad 师傅分享的笔记。
-
-
将一个新的 IR-Fuzz 融合进 ast-fuzz,同时修复一些遗留bug。
-
进军 CS144 计算机网络实验,共Lab0- Lab7 八个实验,开始给自己充充电。
本周已完成 Lab0、Lab1。
-
报了一堆不知道fb认不认的洞上去,坐等消息。