首页> 科学研究> 科研团队
数据智能研究中心
发布时间:2025-12-09

1.中心基本信息

    中心名称:数据智能研究中心

    中心简介:以数据为基石,用智能筑未来

    中心合影:

0d9bb263204de9caa9570a3b9422b4af

袁野教授指导学生科研

b7a29158b9748d4533509895a6770d02

中心毕业生合影

694260c9b3f6945c0c61c008544fac5d

中心成员参加国际会议


2.中心核心成员

    中心负责人

IMG_256

       袁野,北京理工大学教授、博士生导师、国家杰青和优青基金获得者。主持国家自然基金重点项目,科技部重点研发项目。曾获国家科技进步二等奖,中国电子学会自然一等奖,教育部和辽宁省科技进步一等奖、全国优秀博士论文提名奖、中国计算机学会优秀博士论文奖。袁博士是中国人工智能学会服务专委副主任、中国计算机学会数据库专业委员会副主任、IEEE、ACM高级会员。主要研究方向为人工智能、大数据。发表相关CCF A类论文200余篇。

 核心教师成员

A person with dark hair wearing a beige jacket AI-generated content may be incorrect.

       张美慧,教授,海外高层次人才,主要研究方向为大数据管理与分析、海量数据集成、新型数据库系统、区块链及人工智能。

       周天飞,教授,海外高层次人才,主要研究方向为多模态大模型、AI for Science、计算机视觉等。

IMG_256

       罗兆经,教授,海外高层次人才,主要研究方向为大数据分析、人工智能、知识驱动机器/深度学习、模型正则化、大数据分析系统。

IMG_256

       李博扬,助理教授,主要研究方向为神经符号数据库、多模态数据智能体、时空数据分析等。

    中心学生规模

       在站博士后、在读博士和硕士研究生100余名。


3.中心研究方向

[神经符号数据库]

       随着人工智能、大数据技术的迅速发展,以ChatGPT为代表的大语言模型和以Deepseek-R1为代表的推理大模型产生巨大影响。ChatGPT对应“卡尼曼双系统”的系统1,是快思考具备实时感知能力;Deepseek-R1对应系统2,是慢思考具有深度推理能力。而高级智能需要二者交互迭代和平衡。神经符号数据库是针对“双系统”构建的数据库,通过融合面向多模数据的神经计算和面向思维数据的符号推理,支撑下一代AI和数据库新范式。本方向从神经符号复杂查询表达、神经符号原生查询优化、近数据计算混合引擎、执行加速的存储结构等方向开展研究,使神经符号数据库能够支撑双系统AI的高效训推。


[多模态大模型]

       多模态大模型是通向通用人工智能的核心方向,团队关注多模态大模型的基础理论与关键技术创新,研究内容涵盖新一代大模型架构设计、多模态表征学习、多模态推理、强化学习与自演进机制以及自主智能体系统等,核心目标是构建具备强通用性、自主推理与自演化能力的多模态智能系统,广泛应用于工业、医疗、军事、金融等关键领域。


[AI for Science]

       AI for Science是引领科学范式革命、加速人类知识发现与创新的新方向,团队致力于AI4S的基础算法创新与科学场景深度融合,研究内容涵盖科学基础大模型构建、多尺度科学模拟、神经符号融合科学推理、科学数据智能等,核心目标是构建具备自主科学发现能力的新一代智能科研系统,重塑传统研究路径,并推动其在临近空间环境认知、海洋气象预测、新材料设计等关键领域的深度应用。


[可信数据计算]

      可信数据计算作为保障数据完整性与可信性的关键技术,旨在通过创新方法提升存储、溯源和事务处理性能。针对防篡改存储效率瓶颈, 研究结构不变可复用索引理论,结合 Merkle 树与跨版本内容分片技术,突破可信存储系统的冗余写入与查询性能局限; 进一步构建细粒度运行时数据溯源框架,通过智能合约依赖链实时捕获机制,实现毫秒级跨版本溯源追踪与多级依赖关系解析;针对可信执行框架下高并发事务冲突难题,研究基于强串行化定理的细粒度事务管理模型,融合依赖图拓扑排序与动态重提交策略,破解事务中止率与吞吐量的矛盾。


 4.中心研究成果

       在NeurIPS、ICML、KDD、SIGMOD、VLDB等CCF-A类会议和期刊上发表论文200余篇,出版专著2部。获得国家科技进步二等奖、教育部技术发明一等奖、电子学会自然科学一等奖等国家和省部级奖励,以及VLDB青年成就奖、计算机学会青年科学家、ACM杰出科学家、SIGMOD系统奖、SIGMOD研究亮点奖、VLDB最佳论文奖等奖项。谷歌学术总引用数20000余次,论文入选ESI高被引。研究成果服务于一带一路、数字金融、强军工程等国家重大战略,获30多位院士或ACM/IEEE Fellow的正面评价,被纳入多部英文专著和经典教材中,与航天科工集团、中国电科、中国电子、支付宝、网易、阿里巴巴、北京天坛医院等多家大型企业和机构建立了深厚的合作。


[多源异构数据湖管理系统]

       研制了多源异构数据湖管理系统,提出了跨模修复与多模融合、蓝光存储与智能调度、批流融合计算与混合查询优化等技术创新,开辟了数据湖“概念-技术-应用” 全链条发展的新途径。成果已应用于“东数西算”、“一带一路”、“数据要素化” 等国家战略工程,服务了“一带一路”14个国家、国内300余个城市,获得国际社会的高度赞扬,为多源异构数据湖创新发展提供中国方案,获国家科技进步二等奖、电子学会科技进步一等奖。


[复杂语义场景下知识图谱系统]

       研制了复杂语义数据的时序知识图谱系统—“图立方”,提出了动态融合的全时态“抽-补-存”高阶建模技术、模式解构的多视角“点-线-面”混合查询架构、结构感知的穿透式“连-穿-聚”一体化挖掘范式。成果成功应用于“数字金融”、“普惠金融”与“强军工程”等重大领域,支撑了支付宝(杭州)、众邦银行等单位的关键业务系统,覆盖率全球17亿用户和千万商家,获教育部技术发明一等奖、电子学会自然科学一等奖、日内瓦国际发明金奖和纽伦堡国际发明金奖。


[多方可信数据计算系统]

       研制多方可信数据计算系统,提出了基于透明历史操作记录的细粒度数据实时溯源方法, 构建了结构不变可复用的多级可验证索引理论框架,实现了毫秒级跨域数据溯源与多级验证;构建了数据-模型混合并行架构的分布式计算理论框架,提出了基于自适应缓存加速的跨域数据协同分析方法,实现了亿级规模多级关联数据跨域协同分析。研究成果获得了ACM SIGMOD突出研究奖、ACM SIGMOD 系统奖、 VLDB最佳论文奖等,孵化出Apache顶级开源项目并评为全球十五大通用机器学习框架,并被成功应用于网易、阿里巴巴、北京天坛医院的大数据分析平台中。

 

5.中心文化资源

  • 课题组氛围自由探索、团结协作、创新求是

本团队致力于营造一个“自由探索、团结协作、创新求是”的科研氛围。我们鼓励学术思想的碰撞,支持具有前瞻性的探索。在每周的组会中,既有严谨的学术讨论,也有轻松开放的头脑风暴。在这里,你不仅是完成一个项目,更是与一群志同道合的伙伴共同成长,在解决前沿科学问题的过程中提升自我。

  • 优势资源

顶尖的科研平台:团队依托人工智能学院一流的教学与研究设施,拥有高性能计算集群(GPU服务器),为大数据处理与复杂模型训练提供强大算力支撑。

前沿的科研项目:团队长期从事国家级、省部级重点科研项目,并与国内外顶尖高校、知名互联网企业及研究机构保持紧密合作,能为研究生提供参与具有重大理论与应用价值课题的机会。

优秀的导师团队:指导教师均毕业于海内外知名学府,具有丰富的理论研究和产业落地经验,能为学生提供从选题、技术路线到论文撰写、职业发展的全方位、精细化指导。

广阔的发展前景:团队毕业生在学术界和工业界均备受青睐,多名成员进入国内外顶尖高校深造,或就职于头部互联网公司、金融机构的核心技术岗位。

  • 招生要求

我们热忱欢迎对数据智能领域有浓厚兴趣、具备扎实基础和探索精神的同学加入,熟练掌握Python/Java/C++等至少一门主流编程语言,拥有良好的数据结构与算法基础,具备良好的数学功底。此外,我们尤为看重学生是否具备强烈的责任心、良好的团队协作精神、主动的学习能力以及迎难而上的科研态度。


6.课题组联系方式

       课题组热烈欢迎对数据智能、大模型、大数据分析等领域充满热情的博士后、研究生和本科生(欢迎大二、大三同学申请科研实习)加入!欢迎联系:[liboyang@bit.edu.cn]

 


文字

徐灏

摄影

审核

袁野

栏目统筹

人工智能学院