Sử dụng adrozoo, chỉnh sửa đường dẫn là file begin.txt, số lượng mã hash trong file là số lượng file apk tải về. lựa chọn đường dẫn lưu file apk
Thực hiện tải androguard phiên bản 3.4 (Yêu cầu Python 3.11.4)
pip install androguard==3.4
Sử dụng lệnh
androguard decompile <tên file> -o <tên folder output>
Nhận được 1 folder các gồm các file java và các file thư viện
Thực hiện chỉnh sửa đường dẫn là folder chứa các file java
Run code
python other_fcg.py
Code sẽ chạy và tạo ra 1 file csv chứa các thông tin về các hàm và tọa độ của các hàm trên đồ thị
Nếu không có thư viện nào sử dụng pip install để add thêm thư viện
Thực hiện tải thư viện gensim
pip install gensim
Thực hiện training và tạo model doc2vec
python train_doc2vec.py
Code sẽ tạo ra 1 file model để train doc2vec
Thực hiện chỉnh sử đường dẫn là folder chứa các file java
Run code
python doc2vec.py
Chương trình sẽ tạo ra 1 file csv chứa các hàm đã được dán nhãn và từ đây sẽ đưa vào cnn để thực hiện nhúng vào 1 vector chung
Cài đặt các thư viện liên quan như scikit-learn, tensorflow
Run code training để tạo dữ liệu train CNN
python train_cnn.py
Run code cnn để thực hiện nhúng vector, đổi Function hay Label thành cột dán nhãn trong file csv
python cnn.py
Chương trình sẽ tạo ra 1 file csv chứa thông tin vector sau khi được tạo ra