除了汉字、英文等通用语言文字外,还能同时覆盖蒙古文、藏文、维吾尔文、朝鲜文、壮文、哈萨克文、傣文、乌孜别克文、柯尔克孜文、俄罗斯文、彝文、傈僳文等12种少数民族文字拼写和语法错误的自动检测和纠错。

3月23日,语言文字事业高质量发展研讨会暨科技创新成果推广会在北京举行。大会由中央民族大学国家语言资源监测与研究少数民族语言中心、中国信通院云计算与大数据研究所、上海蜜度信息技术有限公司联合举办。来自学界、新闻出版界和业界的专家学者,围绕新时代语言文字事业高质量发展进行研讨,并发布了蜜度校对通多语言智能校对系统。

填补小语种智能校对应用空白,蜜度校对通多语言智能校对系统发布

语言文字事业高质量发展研讨会暨科技创新成果推广会召开

“国务院办公厅印发的《关于全面加强新时代语言文字工作的意见》中明确提出,要大力推动语言文字与人工智能、大数据、云计算等信息技术的深度融合,加强人工智能环境下自然语言处理等关键问题研究和原创技术研发。”中国信通院云计算与大数据研究所副所长闵栋在致辞中介绍了语言文字工作与人工智能技术融合的政策背景。中国出版协会新闻出版文字规范化工委秘书长、《中国出版》杂志执行主编李淼表示:“语言文字作为文化的重要载体,事关国民素质提高和人的全面发展,在党和国家工作大局中具有重要地位和作用。在人工智能时代,如何借力新技术实现语言文字高质量发展是一项重要课题,期待看到学界业界携手共同深化合作,共同推动语言文字工作高质量发展。”

研讨会上,来自于中央民族大学、新疆大学、内蒙古师范大学、青海师范大学、呼和浩特民族学院、中科院软件研究所、中国社科院民族学与人类学研究所、教育部语言文字应用研究所、中国民族语文翻译中心等高校和科研机构的专家在强调语言文字事业高质量发展工作重要意义的同时,也提出了实际工作中遇到的问题和技术障碍。

中国人民大学信息资源管理学院副教授夏天通过多年实践经验对这些问题进行了解答和探讨。他表示,基于深度学习领域前沿的Transformer架构的语言模型,通过大量的训练和模型优化,能够促进语言文字的规范化工作;在这次会议上正式发布的蜜度校对通多语言智能校对系统正是基于前沿人工智能技术,除了汉字、英文等通用语言文字外,还能同时覆盖蒙古文、藏文、维吾尔文、朝鲜文、壮文、哈萨克文、傣文、乌孜别克文、柯尔克孜文、俄罗斯文、彝文、傈僳文等12种少数民族文字拼写和语法错误的自动检测和纠错,满足多语言文字的日常校对需求。

填补小语种智能校对应用空白,蜜度校对通多语言智能校对系统发布

蜜度校对通多语言智能校对系统发布

中国信通院云计算与大数据研究所内容科技部工程师陈文弢表示,蜜度校对通多语言智能校对系统,实现对12个少数民族语言文字的智能校对,填补了小语种智能校对的空白,将有助于推动语言文字事业高质量发展。

在谈到多语言文字规范化、标准化、信息化工作的未来发展方向时,澎湃新闻副总编辑黄杨、微博政务公益运营总经理李峥嵘、中国新闻出版研究院标准所所长刘颖丽等来自于传媒和出版行业的专家表示,新的传播媒介、形式的快速发展,给语言文字的规范化带来了新的挑战;蜜度校对通推出的包含12种少数民族语言的多语言智能校对系统填补了国内这一应用领域的空白,在后期,则需学界、业界的共同合作,加强应用实践,推动语言文字事业高质量发展。

— 完 —