2024年4月3日,新疆大学建校百年系列学术活动之博达信息论坛第12期在新疆大学顺利举办,本期论坛由新疆大学计算机科学与技术学院和智能科学与技术学院共同主办。本期论坛邀请清华大学电子工程系张超副教授,新疆大学计算机科学与技术学院郭治卿副教授分别做题为《SALMONN:认知导向的视听觉大语言模型》、《AIGC时代下的深伪鉴定研究》学术报告。新疆大学计算机科学与技术学院常务副院长、智能科学与技术学院院长何亮教授担任本次论坛主持人。区内外高校、科研院所等200余名相关人员通过线下或腾讯研讨会参加了本次论坛。
张超副教授的报告重点介绍了其团队提出的首个认知导向的开源听觉模型SALMONN (Speech Audio Language Music Open Neural Network)。与传统的语音识别、音频字幕生成等语音和音频处理任务相比,SALMONN通过将LLM直接与音频和语音编码器连接起来,利用LLM从海量文本中学习得到的人类知识和认知能力,SALMONN实现了对语音、音频事件、音乐等各类音频输入的感知和理解,从而涌现出多语言和跨模态推理等高级能力。最后,报告展望了SALMONN在自然语言处理、人工智能等领域的应用与发展。
郭治卿副教授的学术报告《AIGC时代下的深伪鉴定研究》围绕在人工智能生成内容的Web 3.0时代,深度伪造(Deepfake)可以一键生成大量具有欺骗性的人脸伪造内容的严峻挑战展开。报告介绍了Deepfake技术生成的人脸图像/视频相关的研究背景以及团队近期提出的几类深伪鉴定算法,并对深伪鉴定领域未来的研究进行了展望。
博达信息论坛以推动计算机科学与技术“双一流”学科建设、“夯实基础-深化改革-培养信息化人才”为目标,以对口支援为契机,邀请国内外优秀学者开展学术交流活动,旨在瞄准世界科技前沿,以“信息科学与技术”为圆心,以前沿技术为半径,营造良好的学术氛围,促进学术交流,优化技术人才知识结构,提升研究生综合素质,实现学科内涵式发展,也为国内外信息科技领域的专家学者和新疆各高校师生及新疆科研院所、科技企业搭建一个学术交流平台,探讨信息技术发展趋势与主要挑战。