【研究生课】信息安全技术笔记一
课程安排
前期非常快地讲下密码学
研究生的课程会很宽泛,包含不同领域的安全。
考核
考核安排
是个完成一个课题,要交个大报告
第三周上课前确定要做的课题(在群里发的在线文档),第八、九周做个期中汇报(文献汇报),第十五周开始交最终汇报(研究汇报)
提交一份研究报告,算法要有完整实现
可选课题
网络安全,多媒体内容安全,人工智能安全,区块链及隐私保护
网络安全-入侵检测
做个入侵检测系统(IDS,intrusion detection system),防火墙被攻破后,使用IDS进行防御或检测。
(硬件部署)可以部署在防火墙与服务器之间,通过监听网络信息,确保攻击数据在进入到服务器之前,将其拦截。像旁路由
(软件部署)将IDS部署在服务器上,通过日志来判断。像软路由。
抽象成个二分类问题(是否有攻击)
通过web日志,使用机器学习手段,训练出一个模型,对每一条(实时的)日志进行判断是正常行为或异常行为。将模型部署后,可以对web日志实时进行监控并做出相应处理。
通过TP矩阵评估,False Negitive 越小越好
抽象成个多分类问题(具体是什么类型攻击)
通过web日志,使用机器学习手段,训练出一个模型,对日志打上标签(如远程控制|R2L|remote to local,root提权行为|U2R|user to root等)
通过混淆矩阵评估,对角线越大越好
课程要求
有样本,有输出,性能越高越好,不要把正常行为判断为异常行为,误报率要低。更不要把异常判断为正常,遗漏率要低。
数据集来源
数据集质量决定任务难度,如果异常行为和正常行为差距很明显,任务会简单。如果异常行为和正常行为相似,任务会蛮难。
在网上找个IDS挑战赛的数据集(搜索:NSL-KDD,找近年的),这类比赛的数据集较好,可以看到比赛优秀的项目代码,还可以看到评判标准。
某类攻击行为与正常行为相接近,某类攻击行为与正常行为差距很大,要把这些特征在报告中体现出来
网络安全-恶意代码分类
Malware Classification.
二分类、多分类问题
网络安全-垃圾邮件、短信检测
Spam Mail/SMS Detection.
老师不建议选择,不好做。
思路:对于带有链接的邮件,能否先检测whois注册商来判断是否是正常域名?防止钓鱼网站?
中文的垃圾邮件有可能使用谐音字、或者把单个字拆开成多个字。
多媒体内容安全-隐写与隐写分析
Steganography & Steganalysis
最简单的隐写方法:LSB隐写
将私密信息转换成二进制,逐个的写入到像素最低位。
隐写分析
检测的问题也可以是二分类问题,通过机器学习的方法来做,但隐写分析更难,因为修改很微弱,需要把微弱的痕迹增强并突显。
参考:ALASKA挑战赛(隐写分析挑战赛)
多媒体内容安全-取证与反取证
Forensics & Counter-Forensics
取证:给个照片,判断照片是否被修改(PS过),以及能否定位到修改的部分。视频伪造检测,比如deepfake的部分伪造;声音伪造,A的声音变成B的声音这是全局伪造。
反取证:伪造完成后,不被检测出来(抗取证)
人工智能安全(这部分可以做攻击,可做防御)
机器学习的方法本身是否安全?这部分关心模型本身是否安全。
(相对简单)poisoning attack:在样本训练时,这些样本就是有毒的,打着正常的标签但样本本身有问题。
(相对简单)adversarial attack:不干预训练过程,但使用一个专门设计过的手段,对某个模型的漏洞进行攻击或者绕过,让模型无法检测出来。比如,身上穿着某种图案的衣服,这个图案是专门设计过的,用来对抗摄像头的检测,让摄像头看不到人!
人工智能安全-对抗样本攻击与防御
Adversarial attack & defense
在一个正常熊猫图片上,添加一个干扰因素,人眼看不出什么区别,但对模型来说,会判断成其它生物(猴子)
区块链及隐私保护(不要求写代码)
找个具体的区块链场景,把这个场景的几个典型方法搞透,以及这个场景的发展趋势搞明白
比如搞一个食品追溯