The Wayback Machine - https://web.archive.org/web/20201111211654/https://liuhuanyong.github.io/

刘焕勇,语言学及应用语言学硕士,目前就职于中国科学院软件研究所,兼任数据地平线科技算法总监、南京擎盾科技技术顾问,专注金融、情报两大领域,从事事件抽取、事件演化、情感分析、事理(知识)图谱、常识推理、语言资源构建与应用等研发工作。目前发表相关论文两篇、申请发明专利四项、主持研发自然语言处理技术开放平台数地工场、大规模实时事理知识学习系统学迹、全行业因果链查询与溯源项目寻链系统,并在智能金融、智能情报落地中负责实施了多个项目。致力于面向中文处理的基础知识库建设与理论技术开源共享,目前累计对外开放自然语言处理实践项目六十余个,其中知识图谱与事理图谱类项目十六项。在openkg开放知识图谱联盟中开放工业应用知识库七类,主笔数地工场技术类系列文章二十余篇。

邮箱:lhy_in_blcu@126.com

地址:北京市海淀区中关村南四街4号

项目:https://github.com/liuhuanyong Ranked with githubrank

博客:https://blog.csdn.net/lhy2014

代表文章

2020:刘焕勇等.面向开放文本的逻辑推理知识抽取与事件影响推理探索,Accpeted in 2020 China Conference on Knowledge Graph and Semantic Computing(CCKS 2020)
2020:刘焕勇.事理图谱技术的应用探索与实践之路,数地工场.20200407期
2020:刘焕勇.抽象图谱-通往认知与推理智能的基石,数地工场.20200120期
2019:一种基于事理推荐的逻辑图谱构建及预警方法和装置,专利.110968999A
2019:一种融合多类事理与实体知识的领域事件图谱构建方法和装置,专利.110968700A
2019:刘焕勇.一种因果事件图谱构建方法、系统、装置及存储介质,专利.109726293A
2018:刘焕勇.一种行业文本情感获取方法、装置及存储介质,专利.109284499A
2018:刘焕勇,薛云志.事理图谱,下一代知识图谱,Datahorizon.20181225期
2017:刘焕勇.语言政策领域知识图谱构建初探[D].北京语言大学,2017
2016:刘焕勇.也说“就”[J],唐山师范学院学报,2016年04期

负责项目

年份 项目名称 项目技术点
2020 数地搜搜:大规模实时事理实例搜索与分析平台 实时系统,事理应用,事件追踪,事件检索
2020 学迹:大规模实时事理学习与搜索系统 实证学习,信息检索、问答搜索,知识推理
2020 数地工场:面向事件与数据的开放语义平台 信息抽取、舆情分析、语义计算、信息采集等API
2019 投研云图:事理图谱投研逻辑管理与监测系统 基于事理图谱推荐与管理的智能投研管理与监测
2019 事理图谱Demo:全行业事理图谱查询系统 前因后果模式的搜索展示
2019 事理开放知识图谱资源 知识库数据、知识图谱、开放共享
2018 融合情感与事件的金融期货监控与预测系统 情感分析、事件预测、舆情监控
2018 Datagravition金融知识图谱处理系统 图谱编辑、图谱构建、图谱可视化、事件驱动
2017 语言政策领域知识图谱系统 语言政策本体、语言政策分析、图谱分析与搜索

开源项目(62项)

知识图谱与事理图谱(16项)

项目名称 中文名称 项目技术点
CognitiveInference 认知常识知识库与常识推理 常识知识库、常识推理、推理评估测试
EventKGNELL 学迹事理实时知识库终身学习 事件知识库,实时学习,事件概念,事理逻辑,语言资源
ZhidaoChatbot 基于问答社区的逻辑知识问答 问答社区,逻辑问答
EventPredictBasedOnEG 基于事理图谱的未来事件预测 事理图谱,事件预测
ComplexEventExtraction 复合事件图谱 复合事件,条件事件、反转事件抽取
CausalityEventExtraction 因果事件图谱 因果图谱,因果事件抽取
SequentialEventExtration 顺承事件图谱 动宾短语提取,事件图谱
AbstractKnowledgeGraph 抽象知识图谱 抽象知识图谱,抽象实体,抽象状态,抽象动作
GoodsKG 电商商品概念与销售知识图谱 商品概念,商品类知识
HyponymyExtraction 上下位关系图谱 模式匹配,上下位概念表示
QAonMilitaryKG 军事知识图谱与问答项目 知识图谱,军事,基于模板问答方式
TravelKnowledgeGraph 出行知识图谱 路径规划,推荐,知识模型
PersonRelationKnowledgeGraph 中文人物关系图谱 bootstrapping, 远程监督, 训练数据回标, 关系抽取
QASystemOnKG 医疗知识图谱与自动问答 知识图谱构建及自动问答
LanguageKnowledgeGraph 语言政策知识图谱 Neo4j,Echarts,D3js
TextGrapher 文本结构化图谱表示 EventExtraction,知识表示

语言资源与学习心得(11项)

项目名称 中文名称 项目技术点
KnowledgeGraphSlides 知识图谱CCKS会议报告合集(2013-2018) 知识图谱, 学习资源
CCKS2018Summary CCKS2018会议总结 知识图谱,个人心得
CCL2018Summary CCL2018参会总结 自然语言处理,心得
ChineseSemanticKB 中文处理的12类、百万规模的语义常用词典 中文处理的12类、百万规模的语义常用词典,支持句子扩展、转写、事件抽象与泛化
MiningZhiDaoQACorpus 知道类问答社区数据集 语言资源库,语料库,580万问题,983万问答对
CausalCollocation 频繁因果词对库 语言资源库,因果对
ChineseNLPCorpus 中文自然语言处理处理用语言资源 语言资源库,语义库,常用词典, 语言资源观, 语料库
SentimentWordExpansion 情感词扩展 SOPMI
BaikeInfoExtraction 百科信息抽取 Urllib,xpath
SougouWordCollector 搜狗词库自动构建 Urllib,Scrapy
BaikeKnowledgeSchema 百科知识体系构建 Urllib,xpath,递归,知识库本体概念

自然语言处理基本组件(6项)

项目名称 中文名称 项目技术点
WordSegment 分词 HMM, MAXCUT,Ngram
HuanNLP 自然语言处理组件 HMM, maxent, CRF
Pinyin2Chinese 拼音转文字 Trie树,HMM, bigram
QueryCorrection 查询纠错 edit-distance
ChineseCixing 中文词形查询 字形,音形
ChineseAntiword 中文反义词查询 反义词

信息抽取(5项)

项目名称 中文名称 项目技术点
WordMultiSenseDisambiguation 中文多义词词义消歧 百科知识库,词义语义表示,词义语义相似度计算
TextFeatureExtraction 文本特征提取 IG,CHI ,DF,MI
WordCollocation 搭配抽取 MI
KeyInfoExtraction 关键信息提取 TFIDF,TextRank
EventTriplesExtraction 事件三元组提取 dependency parser

文本挖掘与社会计算(17项)

项目名称 中文名称 项目技术点
IdealWordCloudKit 自定义形状词云项目 wordcloud, tfidf, 可视化
WeiboIndexSpyder 微博指数采集 selenium,xpath
BaiduIndexSpyder 百度指数采集 xpath,selenium
AliIndexSpyder 阿里指数采集 selenium,xpath
DocSentimentAnalysis 基于句法依存的情感分析 Template, Dependencyparser
LearningBasedSentiment 基于深度学习的情感分析 CNN,RNN,ML
MusicLyricChatbot 歌词对对碰 es搜索,歌词知识库
ImportantEventExtractor 文本重要性计算 textrank
ZhuguanDetection 文本主观性计算 subjective knowledge base
SentenceSimilarity 句子相似度计算 distance, hash, haiming ,eidtdistance
TopicCluster 文本话题聚类 LDA,Kmeans
EventMonitor 特定事件追踪 新闻采集,事件监测架构,scrapy
PoemMining 中国古代诗词挖掘 语料库构建,文本挖掘
LawCrimeMining 司法文本挖掘 语料库构建,文本挖掘
CrimeKgAssitant 法律罪行智能助手 知识图谱, 智能预判, 自动问答
ChineseHumorSentiment 中文幽默情绪计算 语料库构建,幽默分类与情绪计算
LanguagePlatform 集成自然语言处理技术的语言平台 Neo4j,Echarts,Django

深度学习与语义表示(7项)

项目名称 中文名称 项目技术点
ChineseTextualInference 中文文本蕴含/推理 Textual entailment, keras, 文本分类
SiameseSentenceSimilarity siamese相似问句匹配 siamese lstm network, keras, 文本分类
MedicalNamedEntityRecognition 中文电子病例命名实体识别 keras, bi-lstm-crf
ChineseEmbedding 中文向量大全(字符向量、词向量、拼音向量、依存向量、词性向量) SKIP-GRAM,Co-Matrix
Word2Vector 词向量表示 CBOW, SKIP-GRAM,Co-Matrix
Sentence2Vector 句子向量表示 CBOW
Seq2SeqTranslation 端到端的翻译模型 keras, lstm