10月30日上午,澴川讲坛(第323讲)在明德楼六楼会议室隆重举办。北京大学艾明要教授为我院师生作了题为“Optimal Distributed Subsampling Techniques for Big Data Analysis”的学术报告。报告会由副院长张学新教授主持,我院主要领导及部分师生代表、孝感市统计局资深专家近八十余人聆听了本次会议。
艾明要教授首先在报告中提出人工智能的核心技术是统计学,现代统计分析应遵循“数据有效性,效应稀疏性,模型简约性与计算实时性”四项基本原则。随后艾教授介绍了不同模型的子抽样技术。针对大数据情形下,广义线性模型的拟似然估计时不能一次性计算出非均匀子抽样概率的问题,他的科研团队提出一种分布式泊松子抽样技术,并通过模拟数据集和实际数据集的数值实验,对他们的研究结果进行了评估和解释。
艾教授的报告开阔了我院统计学、数据科学与大数据技术专业师生的视野,使师生进一步了解子采样方法是减轻大数据计算复杂性、保持统计推断效率的有效方法。报告激发了学生在统计学与大数据专业领域的兴趣。本次学术交流也为我院依托国内著名大学学院进行科研与学术交流合作打下了良好的基础。
专家简介:艾明要,北京大学数学科学学院统计学二级教授、博士生导师。兼任全国应用统计专业学位研究生教育指导委员会委员、培养组组长,中国现场统计研究会副理事长,试验设计分会理事长,高维数据统计分会副理事长,统计调查分会副理事长。中国数学会理事,普及与传播工作委员会委员,均匀设计分会副理事长,概率统计学会第十一届理事会秘书长,中国统计学会常务理事。担任四个国际重要SCI期刊Stat Sinica、JSPI、SPL和Stat编委,国内核心期刊《系统科学与数学》《数理统计与管理》《数学进展》编委,科学出版社《统计与数据科学丛书》编委。主要从事大数据采样理论与算法、试验设计与分析、计算机仿真试验与建模、应用统计的教学和研究工作,在AOS、JASA、Biometrika、《中国科学》等国内外重要期刊发表学术论文八十余篇。主持国家自然科学基金重点项目1项、重点项目子课题1项、面上项目5项,参与完成科技部重点研发计划项目2项。曾获得北京大学优秀博士学位论文指导教师和北京市高等学校优秀教学成果奖二等奖。