课程安排

前期非常快地讲下密码学

研究生的课程会很宽泛，包含不同领域的安全。

考核

考核安排

是个完成一个课题，要交个大报告

第三周上课前确定要做的课题（在群里发的在线文档），第八、九周做个期中汇报（文献汇报），第十五周开始交最终汇报（研究汇报）

提交一份研究报告，算法要有完整实现

可选课题

网络安全，多媒体内容安全，人工智能安全，区块链及隐私保护

网络安全-入侵检测

做个入侵检测系统（IDS,intrusion detection system)，防火墙被攻破后，使用IDS进行防御或检测。

（硬件部署）可以部署在防火墙与服务器之间，通过监听网络信息，确保攻击数据在进入到服务器之前，将其拦截。像旁路由

（软件部署）将IDS部署在服务器上，通过日志来判断。像软路由。

抽象成个二分类问题（是否有攻击）

通过web日志，使用机器学习手段，训练出一个模型，对每一条（实时的）日志进行判断是正常行为或异常行为。将模型部署后，可以对web日志实时进行监控并做出相应处理。

通过TP矩阵评估，False Negitive 越小越好

抽象成个多分类问题（具体是什么类型攻击）

通过web日志，使用机器学习手段，训练出一个模型，对日志打上标签（如远程控制|R2L|remote to local，root提权行为|U2R|user to root等）

通过混淆矩阵评估，对角线越大越好

课程要求

有样本，有输出，性能越高越好，不要把正常行为判断为异常行为，误报率要低。更不要把异常判断为正常，遗漏率要低。

数据集来源

数据集质量决定任务难度，如果异常行为和正常行为差距很明显，任务会简单。如果异常行为和正常行为相似，任务会蛮难。

在网上找个IDS挑战赛的数据集(搜索：NSL-KDD，找近年的)，这类比赛的数据集较好，可以看到比赛优秀的项目代码，还可以看到评判标准。

某类攻击行为与正常行为相接近，某类攻击行为与正常行为差距很大，要把这些特征在报告中体现出来

网络安全-恶意代码分类

Malware Classification.

二分类、多分类问题

网络安全-垃圾邮件、短信检测

Spam Mail/SMS Detection.

老师不建议选择，不好做。

思路：对于带有链接的邮件，能否先检测whois注册商来判断是否是正常域名？防止钓鱼网站？

中文的垃圾邮件有可能使用谐音字、或者把单个字拆开成多个字。

多媒体内容安全-隐写与隐写分析

Steganography & Steganalysis

最简单的隐写方法：LSB隐写

将私密信息转换成二进制，逐个的写入到像素最低位。

隐写分析

检测的问题也可以是二分类问题，通过机器学习的方法来做，但隐写分析更难，因为修改很微弱，需要把微弱的痕迹增强并突显。

参考：ALASKA挑战赛（隐写分析挑战赛）

多媒体内容安全-取证与反取证

Forensics & Counter-Forensics

取证：给个照片，判断照片是否被修改（PS过），以及能否定位到修改的部分。视频伪造检测，比如deepfake的部分伪造；声音伪造，A的声音变成B的声音这是全局伪造。

反取证：伪造完成后，不被检测出来（抗取证）

人工智能安全（这部分可以做攻击，可做防御）

机器学习的方法本身是否安全？这部分关心模型本身是否安全。

（相对简单）poisoning attack：在样本训练时，这些样本就是有毒的，打着正常的标签但样本本身有问题。

（相对简单）adversarial attack：不干预训练过程，但使用一个专门设计过的手段，对某个模型的漏洞进行攻击或者绕过，让模型无法检测出来。比如，身上穿着某种图案的衣服，这个图案是专门设计过的，用来对抗摄像头的检测，让摄像头看不到人！

人工智能安全-对抗样本攻击与防御

Adversarial attack & defense

在一个正常熊猫图片上，添加一个干扰因素，人眼看不出什么区别，但对模型来说，会判断成其它生物（猴子）

区块链及隐私保护（不要求写代码）

找个具体的区块链场景，把这个场景的几个典型方法搞透，以及这个场景的发展趋势搞明白

比如搞一个食品追溯