此repo包含用於將域分類為DGA或良性域的非常簡單的程式碼。此程式碼在我們的arxiv論文中展示了我們的結果:https://arxiv.org/abs/1611.00791。一個區別是數据集。這篇論文和這篇文章都使用AlexaTop100萬作為良性的,但是為了簡單起見,這篇文章生成了自己的功能變數名稱。
本文只實現了LSTM和bigram分類器。這是兩個最好的分類器,很容易在Keras中實現。
運行程式碼
python run.py將下載並生成所有數據,訓練和評估分類器,並將PNG保存到磁片(ROC曲線),默認為1倍以加快速度。這段程式碼將運行在您的本地電腦上,或者運行在帶有GPU的電腦上(GPU當然要快得多)。
python run.py
DGA算灋
我們的回購協定中有11個DGA算灋。有些來自https://github.com/baderj/domain_generation_algorithmsrepo。我們在每個檔案中都注意到了這些,並保持了相同的GNU許可證。但是,我們做了一些小的編輯,因為不允許TLD,並且改變了一些算灋的大小。