年6月23日下午,“AI未来说·青年学术论坛”第六期机器学习专场,在中国科学院大学中关村校区3号教学楼S阶梯教室举行。
“AI未来说·青年学术论坛”系列讲座由中国科学院大学主办,百度全力支持,读芯术作为合作自媒体。承办单位为中国科学院大学学生会,协办单位为中国科学院计算所研究生会、网络中心研究生会、人工智能学院学生会、化学工程学院学生会、公共政策与管理学院学生会、微电子学院学生会。
机器学习是人工智能的一个分支,也是人工智能的一种实现方法。它使机器能够自动学习并从经验中不断地对自身进行改进,从某种意义上说,是让机器通过获得思考能力来解决问题的方法。机器学习从样本数据中学习得到知识和规律,然后用于实际的推断和决策,是一种数据驱动的方法,它包括多种问题的定义,提供多种不同的算法,因此,能解决不同领域的各种问题。目前,机器学习已广泛应用于各个行业,如图像识别、语音识别、搜索引擎、商品推荐、医疗诊断、无人驾驶以及自然语言处理等。
本次论坛共邀请到5位嘉宾,包括中国科学院自动化研究所张文生研究员、中国科学院计算机技术研究所庄福振副研究员、百度深度学习技术平台部主任架构师胡晓光老师、清华大学王奕森博士和南京大学赵申宜博士。
张文生研究员作“健康医疗大数据时代的认知计算”的报告分享
作为中国科学院自动化研究所研究员、博士生导师、中国科学院大学人工智能首席教授、中科麦迪人工智能创新研究院院长,国家“云计算和大数据”重点专项总体组专家,中国人工智能学会智能服务专委会副主任,张文生老师报告的主要内容包括医生诊断的数学模型、数学模型不可计算性、认知计算与智能医生、大数据融入智能医生和认识计算的现在与未来五个部分。
报告首先以医生诊疗过程引入,介绍了疾病诊断问题的数学模型,并从疾病诊断是非确定性问题、精准计算难以实现的问题出发,给出了医疗大数据分析的未来几个要点。然后介绍了认知计算模型结构及原理、认知计算与智能医生模型,进而讲到了健康诊疗行业的聚焦与布局,并详细讲解了IBM的人工智能问答系统Watson和医疗专家系统MYCIN的案例。接着,分析了Watson的成败,并从大数据提升医疗智能的角度讲到了未来治疗生态,并介绍了融合语义交互的智能问医生的语义分析架构和智能问医生线上APP应用,以及他们团队所作的糖尿病视网膜病变辅助诊断的工作。最后,展示了自己在医疗大数据应用落地方面所做的工作。
庄福振副研究员作“基于知识共享的机器学习算法研究及应用”的报告分享
作为中国科学院计算技术研究所副研究员、硕士生导师、中国人工智能学会机器学习专委会委员、中国计算机学会模式识别与人工智能专委会委员,庄福振老师报告的主要内容包括基于知识共享模型的基本概念介绍、团队在基于知识共享的机器学习和数据挖掘算法方面所做的研究工作及其未来方向三个部分。
报告首先介绍了大数据及应用场景,并以大数据分类为例讲到了数据标注这一应用难点,引出了基于知识共享的四种模型(迁移学习、多任务学习、多视图学习和模型融合),进而探讨了这些模型之间的区别与联系。然后,分别对迁移学习、多任务学习、多视图学习的概念及其应用场景进行了详细的介绍。最后,从理论分析、应用、有向/无向、粗粒度/细粒度和隐私等角度探讨了基于知识共享的机器学习算法研究的未来方向。
胡晓光老师作“飞桨(PaddlePaddle)核心技术与应用实践”的报告分享
作为百度深度学习技术平台部主任架构师,胡晓光老师报告的主要内容包括飞桨总体介绍、飞桨核心框架、飞桨新特性和飞桨模型应用四个部分。
报告首先以深度学习技术在各行业的广泛应用及其在企业应用的流程作为引入,进而介绍了飞桨的演进以及飞桨的全景概览。接着,从飞桨对建模、训练、服务的三大AI场景的支持出发,介绍了飞桨的核心框架,包括组网模块、模型训练、模型表达与优化和PaddleServing,并重点介绍了PythonAPI、计算过程、用户和框架的分工、架构图等核心技术。然后,从飞桨的服务部署能力、模型压缩能力和全功能分布式训练能力等方面介绍了飞桨的新特性。最后,展示了飞桨全面的官方支持模型库,并详细介绍了用于智能视觉的PaddleCV、人脸检测算法PyramidBox、视频分类库、用于智能文本处理的PaddleNLP、语义表示模型ERNIE、机器翻译模型Transformer,同时展示了AI识虫、精密零件智能分拣两个应用案例。最后,给出了飞桨的使用的详细的资料。
王奕森博士作“AdversarialMachineLearning:AttackandDefense”的报告分享
作为清华大学计算机科学与技术系博士毕业生,美国乔治亚理工大学和澳大利亚墨尔本大学访问学者,百度奖学金获得者,王奕森博士报告的主要内容包括:对抗机器学习研究意义、对抗学习的攻击(Attack)和防御(Defence)介绍、对抗训练中的收敛质量的指标FOSC(First-OrderStationaryCondition)和动态对抗训练算法以及总结四个部分。
报告首先以机器学习顶会中的bestpaper作为引入,展示了学术界对对抗机器学习的