一家国际知名航空公司飞机每天需完成约10万条飞行维修日志的实时翻译、译后信息处理。巨量翻译任务需提供汉英机器翻译,谁能解决?
一家全球生物制药集团和国内三甲医院正推进医疗Al,其中有大量翻译工作,如电子病历结构化处理、医疗文本分析、智能辅助诊疗、智能分诊问诊等,谁能提供机器翻译系统以提升协同效率?
不就是翻译么?乍一看,这事儿不难。但实际上,这是一个很难的课题——涉及一项世界前沿技术——自然语言处理(Nature Language Processing,NLP)。
NLP是计算机科学领域与人工智能领域中的一个重要方向,是一门融语言学、计算机科学、数学于一体的科学。它可使计算机像人类一样理解、处理和生成语言。
直白地说,NLP就是让计算机理解和处理人类自然语言的技术。该技术与计算机视觉、语音处理的区别在于信息处理的类型不同。目前,搜索引擎、机器翻译以及语音助理都离不开该技术的支持。
AI人工智能已成新一轮产业变革的核心驱动力,正释放200多年间三次科技革命和产业变革的巨大能量。而NLP则是人工智能领域最核心的节点和难点,被誉为“人工智能皇冠上的明珠”,世界各国为之争相角逐。
怎么讲?
计算机视觉主要处理图像,语音技术处理声音,NLP主要是对文字的理解,负责将抽象文字符号转化为计算机能理解的语言。
如果说人工智能是在模拟人类,那么认知智能则是在模拟人类的“大脑”:信息的深度处理、理解和反馈都需要该技术完成。后深度学习时代,认知智能已成新焦点。
外界少有人知的是,本文开头抛出的两大难题已被一家中国企业攻克。不仅如此,这家企业自2019年以来,应用成熟的机器翻译技术、产品,已成功服务全球最大航空公司、全球最大电商企业、全球知名药品生产企业,完成了文化出海的产品设计及海外市场拓展。
这家企业名叫——北京中科凡语科技有限公司(以下简称中科凡语)。
中科凡语成立于2018年,其创办班底为中科院自动化研究所模式识别国家重点实验室自然语言处理研究团队。它的定位是“机器翻译及多语言信息处理解决方案提供商”。
周玉是公司创始人兼董事长,见过她的人都说:斯斯文文,端庄而柔弱。她是中科院自动化研究所教授级高级工程师、自然语言处理团队总工程师、博士生导师。在机器翻译、自动摘要、自然语言处理等领域深耕多年,主持过多项国家和横向项目,在自然语言处理及机器翻译研发方面有10多年经验。
依托中国科学院自动化研究所在人工智能、机器翻译和自然语言处理等方面的深厚积累,中科凡语拥有国内顶尖人工智能NLP团队。团队首席科学家宗成庆是中科院自动化所研究员、博士生导师,现任国家重点研发计划重点专项首席科学家。
中科凡语研发了自底向上的自然语言处理各个模块的算法和工具,多语言机器翻译和多语言信息分析与处理系统广泛应用于政府、医疗、科技和商务等领域。
中科凡语在人工智能、自然语言处理、机器翻译等方向积累深厚,自主研发了自然语言处理算法和工具,向不同行业提供解决方案,推出五大NLP技术产品,即“信译”、“信推”、“信析”、“信服”和“信取”。
其中,“信译”智能翻译系统,采用国际最先进的深度学习算法,针对不同垂直领域精准训练,为用户提供最优质、专业、准确、高效的机器翻译服务。它支持70多个语种,包括英语、日语、韩语、俄语、西班牙语等主要语种;蒙古语、藏语、维吾尔语等国内少数民族语种;泰语、越南语、缅甸语、阿拉伯语等“一带一路”国家语种。
“五信”系统的推出,展示了中科凡语深厚的技术积淀。
去年9月中国国际服务贸易交易会上,中科凡语自主研发的“基于神经网络及领域知识的机器混译系统成套装备”一经亮相,便成全场焦点。该装备已被列为2019年中关村首套重大技术装备试验、示范项目。
该装备是一款可离线运行、为用户提供专属定制化的机器翻译引擎。其优势在于:几乎涵盖大多数常用文档格式,支持百万级别术语库、记忆库,低功耗、携带方便,可即时提供面向不同专业领域的翻译服务。
公司推出的NLP三大平台:飞译CAT平台、全网态势洞知平台、公文智能写作平台,表现不俗。
飞译CAT平台是一个可提供众多翻译学习方法、辅助翻译技术和全球资讯等服务的AI赋能平台。该平台根据国内外用户的需求,推出四大版本,即高校版、医疗版、通用版和个人版,全方位覆盖了不同人群、不同领域、不同需求。
中科凡语面向国防、航天航空、医疗科技、文化教育等垂直领域设计了定制化翻译及信息分析服务工具,还承担了多项面向国家和政府重大战略需求的合作项目,如为“一带一路”沿线国家提供翻译、信息整合及分析服务等。
目前,所有产品均已实现市场化高效转化。
2019年12月28日,《环球时报》、《经济》杂志社、中国企业网等联合主办的第二届亚洲经济大会上,中科凡语荣获“一带一路”多语言服务杰出贡献奖,是人工智能NLP领域唯一出海并获此殊荣的企业。
周玉董事长介绍,“翻译+NLP”服务的作用更多体现在两个方面:一是效率,二是“信、达、雅”。中科凡语基于先进的算法模型和数亿级的语料库,适配新的行业应用,最快定制迁移周期为一到两周时间。
业界专家评价,在NLP特别是机器翻译领域,可深入其他垂直领域提供定制化服务的公司,在全球范围内并不多见。
6月18日,由中国科学院自动化研究所模式识别国家重点实验室、中国外文局翻译专业资格考评中心联合主办,中科凡语承办的2021语言AI发展大会在湖北武汉举行。
来自国内外的NLP领域专家、学者、教授,以及产业代表等150余人,共同探讨了未来AI时代自然语言处理的发展方向,为“政产学研用”创造对接、耦合、落地的平台。
周玉董事长在会上宣布“洞知”全网态势洞知平台上线,同时启动“语爱校园”公益项目。
为提升国内部分高校在语言AI领域的水准,解决师生在跨语言教育或学习中的相关障碍。中科凡语将筛选100家国内高校,为每校捐赠一套NLP产品。
11月12日,中国外文局翻译院与中科凡语签署协议,双方就共建智能翻译实验室、开展翻译领域技术赋能模式研发合作。根据协议,双方将共建共享语料库、术语库、人才库、翻译院官网及中国外文界多语种终身学习平台“三库一网一平台”建设。通过市场化、商业化运作,提高产业反哺支持事业的能力,更好地服务国际传播工作大局。
中科凡语已成为政府部门、公安系统、航空航天、科技教育和商务外贸等不同领域客户首选合作伙伴,并为其提供机器翻译系统,多语言信息分析、处理服务与解决方案等。
在科技领域,中科凡语也有不少客户,它们包括阿里、华为、联想、金山等。
业内专家介绍,NLP技术是世界性的难题,技术壁垒非常高。从“可用”到“好用”,NLP发展尚有很长的路要走。
摘取“明珠”之路殊为艰难。
NLP具体应用环境的复杂程度使其无法同时满足终端客户、IT管理者、运营管理者等关键用户的核心诉求。
与同样热门的计算机视觉领域相比,NLP技术并未达到同样高度。不少专注于计算机视觉的公司已进入了商业化“快车道”……
究其主要原因在于:NLP领域各项业务和技术模块都与业务领域和业务逻辑高度捆绑,需根据不同领域、不同业务场景的需求高度定制。
Google、Facebook、阿里巴巴、百度等巨头均已在NLP领域布局。但这些大企业的NLP产品通常对内服务自身业务,对外则以通用型产品为主。
中科凡语推出产品的难度在于,它要基于军事、政治、法律、航空、医疗等多个细分领域,满足各行业各领域的特定需求,故难题更大。
NLP技术一旦普及,将助推智能化改变人们工作、生活的方方面面。
我国持续加大NLP领域研发投入,国内对其需求呈爆发增长态势。目前,国内NLP在生活场景的应用占比不到1%,市场缺口较大。预计10年内其占比将突破50%,甚至更多。
微软亚洲研究院认为,未来十年是NLP发展的黄金档。
2017年,国务院印发《新一代人工智能发展规划》,制定三步走战略,将其提升至国家战略层面。同年10月,人工智能写入党的十九大报告。
全球资本和企业深知:NLP是认知智能阶段技术发展的基石,所以纷纷给予足够关注与投入。目前中科凡语已获二轮数千万级融资,企业发展趋势持续向好。
谈及未来,周玉董事长表示,中科凡语将以多语言信息处理解决方案为主要业务,围绕“一专多能”发力。“一专”是指中科凡语自主研发的多语言智能翻译系统,“多能”则包括:智能处理、智能写作、智能摘要、智能推送、智能检索、智能问答等。
中科凡语的每一个技术突破,都将为国防、航空、医疗、教育、电商等领域赋能。
让我们一起分享中科凡语获得认证和奖励的足迹:
“基于神经网络及领域知识的机器混译系统”等一系列产品通过鲲鹏技术认证,与华为云完成兼容性测试;“基于多语种的OCR识别系统”等一系列产品正在进行飞腾技术认证,与百度昆仑加速卡完成兼容性适配;
中科凡语已获78项发明专利、软著及著作;
核心技术团队荣获2014年获“钱伟长中文信息处理科学技术奖”一等奖、中国电子学会科技进步一等奖、2015年度国家科技进步奖二等奖;
2019年9月,中科凡语获得中关村高新技术企业认证;同年12月,获得国家级高新技术企业认证;
第五届中国健康信息处理大会评测大赛第一赛道临床术语标准化任务中,中科凡语进入前三甲;
中科凡语通过了双软认证、创新创业型企业认证;
2020年1月,中科凡语被列为“中关村金种子企业”,进入中关村前沿技术储备项目库;
2020年10月,全国大众创业万众创新活动周北京分会场——中关村国际前沿科技创新大赛上,中科凡语从数百家高新企业中脱颖而出,入围人工智能领域TOP10榜单;
2020年11月,中科凡语荣获“2020全国移动互联创新大赛(社会组)决赛一等奖”及单项奖“最具市场潜力奖”;
中科凡语陆续通过质量管理体系ISO9001认证、信息安全管理体系IEC27001认证、企业信用等级AAA认证、知识产权管理体系认证;
……
让我们一起祝福周玉董事长领衔的中科凡语早日摘得“明珠”!
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/93699.html