请问从短文本(50字以内)提取时间信息这种需求
有现成的解决方案吗?有可以参考的论文吗?这算不算是某种从A提取B的特殊情况,已经有了通用性的算法了呢?应该怎么下手搜集资料呢,,,除了硬匹配关键词,完全没有头绪。
1
Wyatts 2015-02-21 16:55:02 +08:00
有一个叫做正则表达式的神奇的东西
日期(年-月-日) (\d{4}|\d{2})-((1[0-2])|(0?[1-9]))-(([12][0-9])|(3[01])|(0?[1-9])) 日期(月/日/年) ((1[0-2])|(0?[1-9]))/(([12][0-9])|(3[01])|(0?[1-9]))/(\d{4}|\d{2}) 时间(小时:分钟, 24小时制) ((1|0?)[0-9]|2[0-3]):([0-5][0-9]) |
2
xenme 2015-02-21 17:22:48 +08:00 via iPhone
|
5
shoumu 2015-02-21 18:17:59 +08:00
主要是基于规则的
temporal expression |
6
moshoujingli OP @xenme 嗯,就是这个意思,提取明显指代了时间的短语…
|
7
kofj 2015-02-21 19:35:45 +08:00 via iPhone
NLG
|
9
arachide 2015-02-21 20:44:06 +08:00
提取时间的不知道
提取摘要的一个小孩做的summply 雅虎几千万收购了 |
10
moshoujingli OP @akfish 感觉上就是这个!谢谢!
|
11
moshoujingli OP @arachide 小孩…
|