刘华
发布者: 发布时间:2020-12-11 阅读: 4768
导师姓名: 刘华 | |
联系方式 | |
| |
基本情况 | |
刘华,男,1975年生,博士,暨南大学教授、暨南杰青、博士生、博士后合作导师,国家语委-暨南大学(共建)“海外华语研究中心”副主任,英国谢菲尔德大学访问学者。 广东省“千百十”省级培养对象,国家语委语言文字应用研究优秀中青年学者、国家语委语言文字出国研修优秀中青年学者;《中国语言生活状况报告》(2005-2012)编委、《中国语言生活绿皮书》(系列)编委(2005-2012),北京成像技术高精尖创新中心(首都师范大学)、北京语言资源高精尖创新中心(北京语言大学)兼职研究员;国家社科、国家语委、教育部项目/成果通讯评审专家,《厦门大学学报》《华文教学与研究》等期刊审稿专家。 本科、硕士所学专业是文学和语言学,博士期间主攻语料库、计算语言学和计算机软件,具有较好的语言学特别是计算语言学功底,熟练的计算机编程及统计计算技能,文理兼修。 近年来,出版著作3部(另外9部即出),发表论文50余篇(其中10余篇被3大索引检索),主持国家社科基金项目4项、主持省部级项目11项(重大项目2项),获省部级优秀科研、教学成果奖各1项,建设语料库60余亿字,研发软件8个,多次赴英国、意大利、日本、新加坡、印尼、泰国等地讲学。 | |
教育经历 | |
1、1994年-1998年,湖南科技大学,中国语言文学,本科,学士 2、1999年-2002年,云南师范大学,语言学及应用语言学,硕士 3、2002年-2005年,北京语言大学,计算语言学,博士 4、2019年-2019年,英国谢菲尔德大学,应用语言学,高级访问学者 | |
工作经历 | |
1、2002-2004,教育部语用所,助理研究员,计算语言学 2、2005-2008,暨南大学,讲师,计算语言学、汉语国际教育 3、2008-2012,暨南大学,副教授,硕导,计算语言学、汉语国际教育 4、2012-至今,暨南大学,教授,博导,计算语言学、汉语国际教育 | |
学术创新 | |
基于大规模语料库,利用计算语言学、数据挖掘方法,辅助汉语/华语及汉语/华语教学、语言生活研究,致力于智能信息处理、智能汉语教学、汉语移动学习等语言科技方面的创新研究与软件开发。在语言科技,如计算语言学、文本综合自动标引、舆情监测、中文作文智能评测与批改、汉语移动学习方面自主创新,打通了产学研一体化通道。 (一)语料库语言学1、理论研究 发表了系列论文,如《全球华语语料库建设及功能研究》《超大规模分类语料库构建》等,完成了专著《语料库语言学——理论、工具与案例》(2020年12月外研社出版)。 《中国社会科学报》2015年4月13日《语料库语言学开启研究新热点》,刊登了对主持人的采访。 2、全球华语语料库 建设了全球首个、最大的“全球华语语料库”:全球华语网站、报纸、教材、留学生作文和口语、文学语料库。 建设了海外华语多媒体语言资源库:华人社区个人、家庭、社区的口语生活场景的录音录像,华语社区语言景观照片,共100G。 完成了“全球华语语料库”网络版字、词、句检索系统。全球华语语料库已成为全球华语研究者首选、必查语料库,教育部、“国家语言资源监测与研究中心”已利用该语料库发布、出版了相关报告和论文。 3、语料库建设与检索统计软件 “汉语助研”软件综合了语料库建设、检索、统计功能,集成了基于语料库方法的汉语字、词、句、篇研究的各项辅助功能。“大数据+计算+软件,让语言研究更轻松”。
(二)计算语言学1、新词语发现 提出了一个基于网页链接分析的新词语发现与聚类的新算法(发表于《中文信息学报》),“中国语言生活状况报告:年度新词语”(国家语委发布,商务印书馆出版)采用了用此方法提取的新词语。 2、词语聚类 基于任意语料,无需先验知识,自动进行词语主题聚类(发表于《中文信息学报》《语言文字应用》《外语研究》)。该方法已用于分领域汉语教学用词表建设、智能广告。国家汉办采用了我们用该方法构建的商务词表作为《BCT商务汉语考试词汇大纲》,国内多家在线广告机构使用了该词语聚类服务。 词语聚类扩展在线检索: 3、汉语教学词语表建设 建设了全球汉语/华文教学教材语料库,利用数据挖掘的方法,完成了“汉语口语教学分级词语表、华文教材核心分级词语表、少儿华语主题分类词语表、商务汉语分级词语表、旅游汉语分级词语表、华文水平测试分级词语表、汉语口语话题聚类词语表、商务汉语功能聚类词语表、旅游汉语话题聚类词语表”等。 (三)海外华语研究建设了全球首个、最大的“全球华语语料库”及网络检索系统。 基于大规模语料库、利用计算语言学方法辅助华语字词使用调查研究,出版了《东南亚华文媒体用字用语研究》专著(2015年),系统描写了东南亚华文媒体的用字用词用语、与汉语对比的情况。完成了东南亚华语基本词语研究。 发表的论文《全球华语语料库建设及功能研究》(2020年)探讨了全球华语语料库建设的理念与功能,《海外华语语言生活研究的理论与方法》(2015年)奠定了华语语言生活研究的理论与方法基础,具有重要指导性意义,《面向东南亚华语语言规划的语言态度调查研究》(2018年)明确了华语语言规划研究的意义与方法。 发表的论文《海外华语语言生活状况调查及华语多媒体语言资源库建设》于2015年荣获广东省哲学社会科学优秀成果奖三等奖。 完成了国内外第一部海外华语的语言生活状况报告《东南亚华人社区华语生活状况报告》(2019年度国家语委优秀成果后期资助项目,即将出版)。 (四)计算语言学辅助汉语教学利用数据挖掘方法,在面向汉语教学的基本词表、领域词表、字词句难易度计算、话题库、语块搭配、交际构式、常用句、影视教学等方面发表了系列成果,出版了《汉语现代教育技术》一书,开发了基于字词句的汉语教学资源库、“汉语助教”软件、移动汉语学习软件。 发表了系列论文:《华裔留学生汉语作文常用框架结构分级使用研究》(2019年)、《少儿华语教学主题分类词表构建》(2017年)、《华文水平词汇大纲》研制(2016年)、《华语作为第一语言教学的常用分级词表研制》(2016年)、《商务汉语常用词语表的重构与等级划分》(2018年)、《汉语教学用话题分类常用词、句、式、篇资源库建设》(2018年)、《汉语教学用话题库及话题分类影视资源库构建》(2014年)。 作为语言学学科唯一的一项,“华文教育用分类分级词表研究”荣获2020年度教育部哲学社会科学研究后期资助重大项目(书稿已完成,外研社即出)。 建设了“少儿华语教学主题分类词表”“华语作为第一语言教学的常用分级词表”“华文词汇等级大纲”。其中,《华文词汇等级大纲》是海外华人地区编写华文教材、编撰华语词典、开展华语课堂教学与华语水平测试的重要参考。 (五)语言智能科技1、综合自动标引 从大规模分类语料库中智能挖掘关键短语及其主题度作为领域知识,完成了一个综合自动标引系统,集成文本分类、主题词标引和自动文摘功能。该系统已应用于机械工业研究院、万方数据等多家机构。 演示地址:
2、词语聚类、词语联想、词语扩展在线检索 对所有140万个网页中文档频数大于20的每一关键词聚类后得到11万个关键词的聚类词语表。 关键词是事先为文档自动标注的主题词,如“智能手机”、“实木地板”、“奥迪A6”。 演示地址:
3、中文作文智能批改系统 面向中国中小学生、华裔华语学习者、汉语二语学习者,建立交互式的中文作文智能批改与评测平台,分别支持语文、华语、汉语作文的智能批改和评测。 演示地址:zwpg.languagetech.cn
4、汉语移动学习APP 开创了汉语移动学习的理论与方法研究新局面,构建了“掌上汉语”APP,2019年申报成功国内外首个汉语移动学习的国家社科基金项目。 | |
代表成果 | |
(一)基于内容计算的文本综合自动标引基于自主研发的中文信息处理技术,改进了特征提取方法,在大规模分类语料库中将具有较强特征表示功能的关键短语提取出来,并按主题聚类。在此基础上,以文本内容语义计算、文本内容自动标引为核心,完成了一个知识与统计相结合的文本分类、主题词标引、自动文摘系统,从而将文本内容以精练准确的形式标引出来,方便用户只须查看容量少信息量大的类目、主题词、摘要,即可快速把握文本内容,提高浏览效率。 演示地址 1、文本分类 立足于影响文本分类最底层、最根本的因素:文本表示中的特征项,利用表义完整的关键短语,提高特征项的完整独立程度,有效克服了传统分类算法中向量空间模型和贝叶斯假设的缺点,在3万篇测试集上(15大类,4级244小类),大类微平均提高了3.1%,小类微平均提高了15%。 立体模型是一个交叉多层级的系统。在纵的方面,是一个层级的系统,采用双向层级小类校正算法分类,一级级分到四层子类。在横的方面,采用兼类多标签分类策略,智能判断文档是否兼类,兼哪几类。大类微平均和宏平均F1值比扁平模型分别提高了1.8和2.7个百分点。 用户可根据需要在分类体系中动态增加删除类目,支持自动训练,提供新分类体系和相对应文档,能够自动训练、分类;交叉多层级立体分类,支持多级分类,可选兼类;分类方法支持领域知识、统计等多种方法。 2、主题词标引 针对主题词的领域不均匀性和邻界域两个特征,首创并模拟计算了主题词表征文本主题特征程度的主题度。结合方差和TFIDF原理,设计了形式化的主题词计算模型。以主题词及其主题度为领域知识,结合统计方法,形成了一个知识与统计相结合的主题词自动标引系统。 系统支持叙词标引、自由词标引、关键词标引,支持文档主题词多级标引;支持基于专家知识的规则标引或纯粹词语计算的统计标引;支持自动训练,无需提供训练文档集即可实现新文档的自动标引。 3、自动文摘 系统基于词语的主题度计算,自动抽取文献关键性句子形成摘要(原文中约20%的文字,可自定义)。 能够以多级体系的形式生成并管理标引词库,可动态编辑、修改、维护标引词;支持自动训练,无需提供新摘要文档语料库,即能实现新文档的自动摘要;摘要可读性强,能覆盖原文献主题。 4、学术贡献与创新性 提出了关键短语的概念,并将之作为文本表示的典型特征,进一步在实验中证明了关键短语比词更适合作为文本表示的特征,能提高文本分类的效果。 通过调节词频的方根,将领域通用词语和领域专类词语结合起来进行词语聚类。 将贝叶斯分类中的频率加权方法改进为频率与词语类别区别度开立方乘积的加权方法,充分利用了大规模语料库的领域知识,实验证明该改进大幅提高了分类效果。 提出了在类别判断时,采用小类校正的方法来提高大类准确率的方法。 在文本分类中,通过判断相似度的最大值和第二大值的比值是否小于阈值来确定文档是否兼类。 提出了细致完整、有一定可操作性的关键词标引的多点综合测试方法,在理论上较好地解决了关键词标引测试难的问题。 该系统为新闻门户网站、图书情报部门、广告公司、汉语教学机构等提供内容计算和管理的解决方案。目前,系统已应用于机械工业研究院、万方数据、北京旗帜创想等机构和公司。 (二)计算语言学辅助汉语智能教学1、汉语智能教学大数据与辅助软件平台 建设了大规模的汉语教材语料库、汉语/华语学习者分级的作文库、汉语口语话题库、各种话题分类词表及大纲;建设了分级的搭配库和例句库、常用词语释义图片库。 构建了“汉语助教”辅助汉语教学软件平台。包括词句篇难易度计算、词语分类聚类、搭配抽取、文本指难、教材生词自动生成与等级分布统计、作文智能评测及批改、领域汉语教学辅助、智能备课等功能模块。 2、字词、句子、段落篇章难易度计算 词语常用度就是词语在时间和空间上均匀分布的程度,可以通过方差和IDF来模拟。 影响篇章段落难易度的因素主要有:段落句子数(句子越多,相对越难)、段落中所有句子难易度的均值、段落中最难句子的难易度(学习者可能因为某一难句而难以理解文意)。 同理,影响句子难易度的因素主要有:句长、句中所用词语难易度的均值、句中难易度最高词语的难易度。句子难易度也可通过这三个因素来综合模拟。 目前,该方法已用于作文智能评测和分级、汉语教材编写难易度分级等领域。 3、汉语教学词汇等级大纲、话题聚类词表 利用独创的文本分类的特征提取算法进行词语的领域聚类,基于汉语教学语料库和词语难易度计算、词语聚类方法,构建了汉语口语、商务汉语、旅游汉语、华文教育的分级分类词汇等级大纲、话题聚类词语表。 其中,汉语口语词汇等级大纲、商务汉语分级词汇等级大纲、华文水平测试词汇等级大纲,以及话题/主题/功能分类的汉语口语、商务汉语、少儿华语的聚类词语表库具有极高的首创性和原创性,对于领域/职业汉语/华语教学和测试具有重要价值。 4、智能汉语影视教学 以常见话题库为纲,截取热门影视剧中相关度高的视频片段,构建话题对应的影视对话字幕库及其对应的影视频库;对各个片段标注场景,按照会话片段与话题的相关程度及片段难易度进行排序分级,方便针对不同层次的汉语教学以及“掌上汉语”APP开发。 5、汉语教学用话题分类常用词句式篇资源库 基于教材和影视字幕中的会话语料,将“话题、交际图式、常用会话、常用句、交际构式、常用词”紧密结合起来,构建了一个面向汉语口语教学的分话题、分图式的常用词句式篇的综合资源库(含视频)。该资源库对于辅助教材编写、在线汉语学习有很高的参考价值。 6、学汉语微信演示版 利用小规模短视频、词语图片、例句等资源开发了学汉语的H5演示系统: (1)“看电影,学汉语”,利用话题化、场景化的多媒体学习资源,提高学习趣味性,让学生“乐学” (2)“集约化学习”,利用最常用、最简洁的多媒体资源(最简方案),达到“精学、快学”的目的 (3)“语伴学习”,个性化、自适应、社交化的移动学习设计,解决线上语言学习缺乏语伴、语境的痛点 7、汉语作文自动评测及分级系统 利用数据挖掘、回归分析方法提取作文分级的评级特征参数,针对中小学生、HSK学生、华裔学生,分别构建分级评测语言模型,研发了语文/汉语/华语作文自动评测及批改系统(演示地址:zwpg.languagetech.cn),并已在国内外10余所小学、汉语教学机构试用。 (三)《语言计算与智能汉语教学》(9卷本)本套书共包括6本理论研究著作和3本汉语教学常用词表。(已与外研社签订出版合同,并已经支付全部出版费,6本书已完成最终审稿编辑,预计2020年11月起陆续出版) 1、《语料库语言学——理论、工具与案例》 本书主要介绍了语料库语言学的基本理论,语料库建设、加工的原则与方法。以“汉语助研”系统的功能说明为例,介绍了语料库各方面的工具应用。同时,提供了各主要功能模块在具体的语言学研究中的使用案例。 “大数据+统计+软件”,让语言研究更轻松。 2、《商务汉语分类分级常用词常用句研究》 本书立足于交际功能,基于商务汉语语料库,以交际图式、心理词库理论为指导,运用计算语言学方法,自上而下地将功能项目、会话、常用句和话题词表等商务汉语的交际因素结合起来,构建了商务汉语教学用功能项目分类的词语表、词汇等级大纲,以及常用句、构式、会话的分类分级资源库。 3、《华语教育用分类分级词表研究》 本书创新了词语分级和词表建设的方法,构建了词汇时空分布模型,基于母语者、华语学习者书面语和口语语料库,计算词语常用度,构建了“华语作为第一语言教学的常用分级词表”“少儿华语教学主题分类词表”以及《华语词汇等级大纲》。 4、《汉语口语教学用话题分类分级常用词句式篇研究》 本书重点探讨了影视汉语教学、话题教学、影视话题自动分割与分级方法,常用句、交际构式抽取与分级方法,以及词语聚类与分级的方法。本书对于专门领域汉语教学、话题词表、词汇等级大纲建设有较大参考价值。 5、《汉语移动学习的理论与方法》 本书描写了汉语移动学习的生态、需求,构建了汉语移动学习的三大理论体系;立足于内容计算的词汇时空分布模型与文本分类方法,构建“等级—水平”话题化、个性化、双向自适应的汉语移动学习模型;最后,基于智能教育、移动学习理念,利用影视短视频,设计了各种类型的APP系统方案。 6、《汉语文本可读性分级及作文自动评测研究》 本书研究了影响文本可读性主客观方面的因素,提出了基于内容的文本可读性计算、阅读自动分级、文本指难的整体解决方案。在作文自动评测方面,本书在语法查错、语言艺术风格、主题内容、篇章结构计算方面做了一些初步探索。 7、《商务汉语分类分级常用词语表》 包括“商务汉语功能项目分类分级常用词语表”和《商务汉语词汇等级大纲》。 “商务汉语功能项目分类分级常用词语表”按照120个商务功能项目,列出各功能项目的常用词语,词语同时配上了拼音、英语注释和《商务汉语词汇等级大纲》的等级。《商务汉语词汇等级大纲》包括四个级别,共4512个词条。 8、《华语教育用分类分级常用词语表》 包括“少儿华语教学主题分类词表”和《华语词汇等级大纲》。 “少儿华语教学主题分类词表”按照59个三级主题,列出各主题的常用词语,共3735个词条,词语同时配上了拼音、英语注释和《华语词汇等级大纲》的等级。《华语词汇等级大纲》分为6个级别,共15,568个词条。 9、《汉语口语分类分级常用词语表》 包括“汉语口语话题分类分级词语表”和《汉语口语词汇等级大纲》。 “汉语口语话题分类分级词语表”按照7个一级话题,42个二级子话题,列出各话题的常用词语,共2382个词条。词语同时配上了拼音、英语注释和《汉语口语词汇等级大纲》的等级。 (四)东南亚华人社区华语生活状况报告1、学术贡献 从社区语言使用、媒体语言生活、风貌和热词热语等角度,全面细致地描写了东南亚华语语言生活状况: (1)东南亚华人社区语言使用问卷调查:个人情况、语言使用、语言能力、语言倾向、媒体使用、语言教育。 (2)海外华文媒体语言生活状况调查:基于语料库,进行华文网络、报刊、教材等用字用语的调查研究。 (3)海外华语口语生活状况及风貌调查:对华语日常交际场景、重大华语节假日生活场景录音录像;对海外含汉字的路牌、招牌、广告等录像照相。以期全方位、多角度、生动真实地反映鲜活的海外华语语言生活实况。 (4)基于华文媒体语料库,探究了十年来国内较有代表性的热词热语在海外华文媒体中的使用情况及其传播特点,探讨其传播动因,以此研究中国语言生活的影响力。 (5)利用问卷对十年间的热词热语的华侨华人、留学生的知晓状况进行了调查,对影响热词热语知晓状况的语言学因素、社会学因素进行探析。 2、特色创新 建立了海外华语语言生活研究的新理念和新方法,确定了海外华语语言生活调查的规范流程和操作指南,全面、大规模地调查并展现了东南亚主要国家的华语语言生活状况。 (1)确立了口语生活场景式的语言生活观、语言风貌多媒体展示理念 大大扩展了语言生活研究的范围,能更多维度、更生动真实地反映海外华侨华人语言生活实态,真正体现语言生活之“生活”本质——接地气的口语生活场景式的多媒体语言风貌。 (2)建立了由面到点,从微观到宏观的立体语言生活调查体系 “华人社区语言使用情况问卷调查”是概貌性的调查,主要展示华语语言生活的面。 “海外华侨华人口语生活场景调查”具体到语言生活的点,包括:微观的个人语言生活、中观的家庭语言生活、宏观的社区语言生活场景调查,层层推进。“海外华文载体语言风貌调查”是书面语的语言风貌的调查。 (3)制定了《海外华语语言生活调查指导手册》 设计了调查内容、流程、规范、标准等指导手册。广泛征求专家意义,将调查流程、规范要求、技术标准固定模式化,形成调查指南和手册。 (4)完成了《东南亚华人社区华语生活状况报告》 报告全面描写了东南亚各主要国家各大城市华人社区的华语生活状况,同时,重点以印度尼西亚为例,详细描写了印度尼西亚的华语生活状况,以及热词热语的海外传播情况。 (5)立足华语使用态度,从语言规划的角度进行华语规划的政策探讨 从语言规划的角度,探讨了:重视华语资源建设和监测对“一带一路”华语语言规划的影响;东南亚华人华语态度存在层级性,华语使用呈现多样性特点;应重视华文新媒体对华语语言规划的聚焦作用。 3、学术价值及社会影响和效益 华语生活状况研究和多媒体华语资源库是国家语言规划和汉语国际传播的重要支撑;描写、展示东南亚华语面貌,抢救性记录和保存华语多媒体语言资源,是保护民族语言文化遗产的历史使命;多媒体华语资源库对于全球汉语信息化和汉语语言科技有巨大的推动作用。 《中国语言生活要况2013》收录了《海外华语语言生活状况调查及华语多媒体语言资源库建设》(《语言文字应用》),2015年,该文获得广东省社会科学优秀成果奖三等奖。 | |
科研教改项目 | |
(一)国家社科基金项目1、汉语移动学习资源建设的理论与方法研究,2019年度国家社科一般项目,20万,2019-2021,19BYY018,主持,进行中 2、华文媒体及教材语料数据库,2019年国家社科重大项目“海外华语资源数据库建设及应用研究”子课题,19ZDA311,15万,2019-2024,主持,进行中 3、海外华语语言生活状况调查及多媒体语言资源库建设,2013年度国家社科一般项目,2013-2017,13BYY090,18万,主持,已结题 4、基于语料库的东南亚华语基本词语研究,2008年度国家社科一般项目,2009-2011,08BYY019,主持,已结题 (二)省部级重大项目5、华文教育用分类分级词表研究,2020年度教育部哲学社会科学研究后期资助重大项目,20万,2020-2021,20JHQ004,主持,进行中 6、东南亚华侨华人语言生活及华语语料库建设研究,广东省“理论粤军”2013年度重大基础理论研究课题,2013-2016,LLYJ1321,30万,主持,已结题 7、中文作文智能评测及批改系统,北京市高精尖创新中心“成像技术”重大项目,94万,2015-2017,主持,已结题 8、基于语料库的汉语热字热词热语海外华语传播研究,2016年国家语委重点项目,2016-2018,ZDI135-6,12万,主持,已结题 (三)省部级一般项目9、东南亚华人社区华语生活状况报告,2019年国家语委后期资助项目,15万,2020-2021,HQ135-34,主持,进行中 10、“汉语助研”语料库建设统计一体化系统,2017年国家语委后期资助项目,2017-2018,HQ135-15,7万,主持,已结题 11、东南亚小学华文教材用字用语调查研究,国家语委一般项目,2010-2011,主持,已结题 12、基于语料库与计算方法的汉语国际教育资源库建设,广东省高层次人才引进项目,2013-2016,15万,主持,已结题 13、基于语料库的海外华语字词研究,广东省社科规划项目,2007-2009,主持,已结题 14、语言计算与智能汉语教学,中央高校基本科研业务费专项,40万,2019-2023,19JNKY09,主持,进行中 15、海外华语资源库建设,北京市高精尖创新中心“语言资源”重大项目子项目,2017-2020,15万,主持,已结题 (四)教改项目17、语料库语言学(广东省研究生精品课程),2016-2019,中央高校教育教学改革专项,主持 18、基于影视资源的汉语移动学习内容建设创新研究,2019-2021,校级教改项目,主持 19、基于慕课平台的“语言科技”教学改革与实践,2015-2017,校级教改项目,主持 20、《汉语口语常用词常用句(初中高三册)》教材建设,2019-2021,校级教改项目,主持 21、“掌上汉语”汉语移动学习APP的开发与创新应用,2019-2021,校级教改项目,主持 | |
发表论文 | |
(一)华语语言生活1、面向东南亚华语语言规划的语言态度调查研究,语言文字应用,2018 2、海外华语语言生活研究的理论与方法,华侨大学学报,2015 3、近年来海外华文教育发展的现状、问题及趋势,东南亚研究,2014 4、东南亚主要华文媒体非通用汉字使用情况调查研究,华文教学与研究,2011 5、小学生习作用字情况调查(第二作者),课程·教材·教法,2011 6、东南亚小学华文教材用字用语情况调查,中国语言生活状况报告(2011),商务印书馆,2011 7、东南亚主要华文媒体用字情况调查,华文教学与研究,2010 8、东南亚华文媒体用字用语调查,中国语言生活状况报告(2010),商务印书馆,2010 9、东南亚华文媒体特色词语,中国语言生活状况报告(2009),商务印书馆,2009 10、东南亚华文媒体字母词调查,中国语言生活状况报告(2009),商务印书馆,2009 (二)语料库语言学11、全球华语语料库建设及功能研究,江汉学术,2020.1 12、海外华语语言生活状况调查及华语多媒体语言资源库建设,语言文字应用,2012 13、超大规模分类语料库构建,现代图书情报技术,2006 14、网页信息抽取及建库系统C#实现,计算机工程,2006 (三)计算语言学15、Study of Corpus-based Methods of Verb Collocations in Modern Chinese,Social science and education,2013 16、汉语信息处理中短语优势的理据及实验证明,语言文字应用,2007 17、基于文本分类中特征提取的领域词语聚类,语言文字应用,2007 18、一种快速获取领域新词语的新方法,中文信息学报,2006 19、词典编撰的领域词语自动获取与选择,计算机工程与应用,2006 20、基于语料库的领域词语聚类C#实现,计算机工程与应用,2006 (四)中文信息处理21、Realization of text categorization for small-scaled dataset,Advanced Materials Research,2012 22、基于关键短语的文本分类研究,中文信息学报,2007 23、Algorithm and Implementation of Stereo Model in Text Categorization,Journal of Computational Information Systems(EI期刊),2007.10 24、改进的简单贝叶斯文本分类,暨南大学学报(自然科学),2007 25、基于分类标注语料库的关键词标引知识自动获取,图书情报工作,2007 26、文本分类C#实现,现代图书情报技术,2007 27、文本分类相似度模型和概率模型的实现与比较,现代图书情报技术,2006 (五)智能汉语教学28、汉语移动学习APP现状与需求调查研究,海外华文教育,2020 29、华裔留学生汉语作文常用框架结构分级使用研究,云南师范大学学报(对外汉语教学与研究版),2019 30、商务汉语常用词语表的重构与等级划分,华文教学与研究,2018 31、汉语教学用话题分类常用词、句、式、篇资源库建设,华文学刊(新加坡),2018 32、少儿华语教学主题分类词表构建,华文教学与研究,2017 33、华语作为第一语言教学的常用分级词表研制,海外华文教育,2016 34、《华文水平词汇大纲》研制,华文学刊(新加坡),2016 35、汉语教学用话题库及话题分类影视资源库构建,世界汉语教学,2014 36、Constructing of Multimedia Resources for Second Language Teaching Based on Intelligent Information Processing Movie Resources,International Journal of Emerging Technologies in Learning(EI期刊),2013 37、面向对外汉语教学的话题聚类研究,外语研究,2008 (六)语言文字资政报告38、完成教育部语信司的60篇《语情信息》的撰写工作,2005-2019 | |
出版著作 | |
1、语言计算与智能汉语教学(9卷本),独著,外研社,2020-2022 2、东南亚华文媒体用字用语研究,独著,暨南大学出版社,2015 3、汉语现代教育技术,第一作者,暨南大学出版社,2015 4、词语计算与应用,独著,暨南大学出版社,2010 | |
科研获奖 | |
1、《海外华语语言生活状况调查及华语多媒体语言资源库建设》,广东省哲学社会科学优秀成果奖,2015年12月,三等奖,第一作者; 2、“大实验”理念下中文类本科生创新能力培养模式的改革与实践,第八届广东省教育教学成果奖(高等教育),2018年5月,二等奖,第五作者; 3、语言文字应用优秀论文奖,2009,第一作者。 |