株式会社岛津制作所(以下简称“岛津制作所”)、富士通株式会社(以下简称“富士通”)、株式会社富士通研究所(以下简称“富士通研究所”)经共同研究※1,成功开发出可应用于大数据处理中的AI(人工智能)技术,该技术在质谱分析结果的解析过程中不可或缺。截至目前的所有研究成果,已在日前召开的“第11届代谢组学研讨会”上发表。
作为ICT(信息通信技术)企业,富士通为实现数字革新,不断探究AI新型商业模式。作为分析仪器制造商,岛津公司受客户委托,致力于“实现复杂数据的高精度自动解析”。诉求一致的两家企业自去年11月起,开始推进数据自动化解析领域AI的共同研究。随着仪器灵敏度、分析速度的不断提升,用于疾病早期发现的技术确立、食品农残检测等各领域研究以及品质管理等用途的质谱分析仪,获得的数据量也急剧增加。在此影响下,被称为“peak picking ”※2的数据解析方式成为作业工程中的一大瓶颈。由于较难实现完全的自动化,并且在一定程度上仍需手动调整,该作业方式存在操作人员操作失误或数据篡改的漏洞,各操作人员间的解析准确率亦参差不齐。近年,在医疗及制药领域,对排除属人为属性的高精度自动化需求愈演愈烈。
为此,3家企业模仿脑神经细胞的神经网DEEP LEARNING(深度学习)的适用性开展探讨,欲通过活用AI解决上述问题。但在研究过程中,遇到两大难题:其一, 训练数据※3不充分;其二,将分析仪器输出数据直接导入深度学习网络后,无法开展学习训练。通过共同研究期间的不懈努力,岛津成功开发出“可弥补训练数据不足的数据生成技术”,富士通・富士通研究所成功开发出“分析仪器输出特征的图像转换技术”及“可学习熟练工解析诀窍的特征提取技术”。目前,已将通过上述技术生成的3万多条训练数据输入深层学习网,供其学习。
与经验者手动peak picking 结果比对后发现,AI自动peak picking 的错误率为7%、未检率为9%※4。即自动peak picking 并不逊色于经验者操作,相关结果达到可使用状态。
在岛津公司2017年4月开展的中期经营计划中,制定了“致力先进医疗、为预防、诊断、治疗以及制药领域提供革新产品及服务”的目标。本次开发的AI,其最初使用的“代谢组学”研究即为其中的一环。代谢组学是一种检测代谢产物并根据其性状特征对细胞开展检查的生物技术。在生理・病理组织的解析、疾病生物标志物的探索等领域备受瞩目。
2015年11月,富士通将积累了超过30年的AI(人工知能)相关知识技术,以“FUJITSU Human Centric AI Zinrai”形式公开发表,积极推进面向各领域用户、商品服务的AI实际应用。目前,又在深度学习的全新领域聚焦“代谢组学”,积极开展可实现数据分析自动化的AI研发。
岛津与富士通的目标为,2018年能将本次成功研发的AI技术导入质谱分析仪器专用软件。
※1 从大阪大学研究生院工学研究专业福崎英一郎教授、该校信息科学研究专业松田史生教授处获得研究人员需求。在岛津制作所、大阪大学开设以代谢组学分析技术研发为目的的“大阪大学・岛津分析革新共同研究讲座”。
※2 从质谱分析数据(图表)中,读取峰宽及峰高的工程。
※3 供深度学习网络开展学习的数据。对输入网络的数据及其输出结果进行编组。本技术应用中,为分析仪器输出数据与相应经验者peak picking 结果的比对组合。
※4 将经验者手动peak picking 结果称作“正确范围”,与AI自动peak picking
结果“预测范围”进行比较。如两者重叠率超过50%,则判断为“匹配”,反之则为“不匹配”。在“匹配”情况下,除被正确检测的峰值外,将预测范围中出现、但无法与正确范围匹配的项目定义为“错误检测”,将正确范围中出现、但无法与预测范围匹配的项目定义为“未检测”。错误检测率计算公式为:错误检测数
/ (检测数+错误检测数)、未检测率计算公式为:未检测数 / (检测数+未检测数)。