1
wshcdr 2014-11-20 09:32:45 +08:00
恩,比较牛的创业公司啊,
|
2
neutrino 2014-11-20 09:34:55 +08:00
赞看paper的哈哈
|
3
xunyu 2014-11-20 09:44:45 +08:00
cto是谁??有多少人在做数据标注呢?
|
4
Gestalt OP @xunyu http://www.bosondata.com.cn/team 第二个。数据标注这种活一般都找学校或者外包之类的,厂里面做好品控就很不容易了。
|
5
fghzpqm 2014-11-20 10:09:10 +08:00
我在这里写 Python,欢迎大家过来一起愉快的玩耍。
|
6
zix 2014-11-20 10:29:12 +08:00 1
好像不错,可是在帝都:(
|
7
soli 2014-11-20 10:37:43 +08:00
很高大上的样子
|
8
tommark 2014-11-20 10:39:55 +08:00
测试”一群牛排着队走着“
结果”一 群 牛排 着 队 走 着“ 分析出了,牛排。。。 |
9
fishleen 2014-11-20 10:40:09 +08:00
问个不相关的,如果要开始做NLP的小项目,哪里开始比较好。我对于NLP很好奇,但是没接触过。
类似于写个插件优化Lucene的搜索结果。 |
10
Gestalt OP |
11
ipush 2014-11-20 10:59:15 +08:00
见过的最牛的招聘贴。 能来北京开个分店吗
|
14
tommark 2014-11-20 11:45:32 +08:00
@Gestalt 可以透露一下你们用的是什么模型吗? 基于概率模型的分词部分我知道有HMM,CRF这两个概率模型,不知道还有没有其他的了
|
15
66CCFF 2014-11-20 11:49:19 +08:00
曾经ICPC的队友和学长在你们这 : -)
还是说……你就是 lyr ? |
19
vibbow 2014-11-20 12:26:18 +08:00
显示器是清华同方的。。。
|
20
xcv58 2014-11-20 12:31:24 +08:00
竟然没有双显示器。
|
21
66beta 2014-11-20 13:23:26 +08:00
没双显示器,差评
|
22
alpha7happy 2014-11-20 13:34:34 +08:00
@tommark 除了模型之外语料也很关键,BosonNLP是有很多自主积累的基础语料和垂直行业语料。我们现在在跟很多行业的合作伙伴一起做NLP的产品和应用开发。
|
24
tommark 2014-11-20 14:17:21 +08:00
@alpha7happy 是的,数据挖掘都有这个通病,好的数据什么算法都能得到好的结果,数据不好,再好的算法也难搞。
|
25
alpha7happy 2014-11-20 14:20:54 +08:00
@tommark 是的,more data beats better algorithm!我们从语料和算法两个方面都在做很多工作。
|
26
vince223 2014-11-20 14:58:14 +08:00
看后决定投个试试,嘿嘿
|
27
imshanks 2014-11-20 15:24:28 +08:00
注册报错?
|
32
Livid MOD V2EX 目前在用的自动标签功能就是 BOSONNLP 提供的。感谢他们,这个产品的准确度和性能一直在提升!
|
33
vilison 2014-11-20 19:08:17 +08:00
demo 看了下,一直卡在loading 状态...
|
34
armysheng 2014-11-20 19:17:48 +08:00
分词,情感分析API provider?
|
35
icyflash 2014-11-20 20:03:00 +08:00
东西不错,赞一个
|
36
lepture 2014-11-20 20:15:30 +08:00
看 demo 好像不能识别繁体字
|
37
linkgod 2014-11-20 20:18:38 +08:00 1
看见标题我就知道是你们,哈哈哈。超靠谱的公司。
CTO开会,同志们又在玩手机,哈哈哈 |
38
chlx 2014-11-20 20:21:32 +08:00
像是NLP相关的外包公司...没多大吸引力
|
40
Gestalt OP |
41
flied 2014-11-20 20:54:49 +08:00
赞“加速信息传播”
我的个人简历里面也有这么一句。“促进信息在更大范围内更加畅通无阻的流通” |
42
gkiwi 2014-11-20 22:49:29 +08:00
赞NLP.新人,求推荐点资料:)
|
45
s51431980 2014-11-20 23:41:20 +08:00
贵公司官网 还是 ©2013 BosonData
|
47
fghzpqm 2014-11-21 00:28:17 +08:00
@s51431980 谢谢支持。目前已修复。
[email protected]_processor +def inject_copyright_year(): + return dict(copyright_year=arrow.now('Asia/Shanghai').format('YYYY')) |
49
coolzjy 2014-12-04 13:47:35 +08:00
注册又要用手机号 果断Ctrl+W
|
50
iyaozhen 2014-12-04 14:01:44 +08:00
NLP太高大上了。我想使用一些api,看后台是试用。不知道价格如何,有没有适合个人开发者的小流量套餐。
|
51
ong 2014-12-04 14:02:16 +08:00
在你们的站点上,没有一个公开的定价页面。
|
52
alpha7happy 2014-12-04 14:09:56 +08:00
|
53
Zzway 2014-12-04 15:33:20 +08:00
虽然JD捻得略正式,若实际上对于开发类的活要求尽限于付捻代码,莫若起码得了解你许的良将(Knowyourlanguage)。虽然敝厂主做捻python,但是未付便没有关系;如果记怕NLP的话需要懂载机器学习的常识为切点算法题(起码能手捻可怜查找或者腻排序之类的吧,很基本了),向ACL之类的水土落过彗搞过算法竞赛(OI、ICPC)那总少了。另外因为产品临河鞭灶未得未移得盛,虽然尽是和NLP相关,但是最终输出有可能是一个分析网站,便有可能是数份报告,须有可能是一个RESTAPI,所以技术临河寝得红羊肠能力便是必须的(话说就是犹怕NLP便做嗅paper啊——说来终久工作就是嗅paper便是一个槽点)。
--------------- 以上是用的“妈妈再也不用担心我的作文了”处理的结果http://t1huan.com/ |
55
Gestalt OP @Zzway 你用的是那个“诗人般的”选项吧?那个是用诗词语料训练的,对诗词的替换效果会好一些,不针对一般文本。默认的“令人发狂的”模式对一般文本替换程度会高一些。
------------ 虽JD写得略完整,但其实由于管理类的活期望值仅剩会写代码,但是至少得体会你用的词语(Knowmyscientific)。虽说敝职工要写c++,但不会也丧失区别;假如想做NLP的话需懂点打印机操练的窍门能杏鲍菇索引题(起码红帽写估设置或堆计费这些的吧,很根本了),在ACL其它的国度发过文搞过程序大赛(OI、ICPC)那最好了。此外由于化妆品类脑洞不得不开得大,虽说都是和NLP核实,可是终究输出有成就感是一个预测平台,也有机会是一份通报,还有成就感是一个RESTAPI,否则工程原则性习得新事情自制力也是一定的(话说就是单做NLP也要看proposal啊——想来偶尔干活正是看proposal也是一个槽点 |
56
MonkeyDLuffy 2014-12-04 17:26:49 +08:00
@Gestalt 求后端工程师职位
|
57
Gestalt OP @MonkeyDLuffy 往 [email protected] 发简历就好。
|
58
orzfly 2014-12-04 18:57:10 +08:00
http://t1huan.com/,哈哈哈哈。
胡诌大致是我攒卡太多积了些RP的原故,在七年前话说美符号分配这事情以后,尽头真到了一个做NLP的厂。虽说我不喜欢直接谢谢他人,而且还是要感激ww.china,谢谢evernote,谢谢运营商……这些的,不然我还在某些房间里写wpota或拿GAE的一套事情搞松鼠……吧?既然,做点十分“加速讯息采编”的麻烦事好了。 有时候MachineLearning大地理学在适当的产业倒是能够培育极大的可信度,或是更关联一点儿氧化,做机子直译、手势辨别或是调用法之类厂都能活得很好了。但在日文符号(句子)分配类,或许钱没砸尽职或设备仍旧不及自然界的预想吧,非websiteswisdom(技术机构专业)关联的分词、统称体读取、议题聚类这些的预测计划,会法语的人都能明白好几残忍的滔天大罪。因为当下把这著述借以干活的样子碰上这些支离破碎的难题也是显而易见的,可是让人劝退根据大规模指标标明的机子练习的事业。但也许,anywerecontinue..(http://en.wikiquote.org/wiki/George_E._P._Box).只在直面三十万报告的时刻,把另关联的零食聚到一块的抑或有一些新意的;辨别出短文中的渠道、集团公司、工会、时光,把一段笔触中的关键字自动含有出来,也不是没挑战性的(包括你如今在某论坛会上看见的)。最根本的一些零食,能看这儿的remix: http://bosonnlp.com/demo此外只要想用这劳什子的RESTAPI爱戴驰名,要是需调用水量能发信件给那个love加。 因此真正做事的钟点,而且无法一句话讲透彻你各个厂是在做啥子,遍布freebsd偶尔也能够表述半天。兴许有别于称为一个运营商集团公司,称其为一个文案机构或者一个报告统计集团公司更为直观。但对应到电气领域的地方,单这一件事细化的类还是多的:提form跑图纸、改进架构、运营学术性、抓报告、做报告印制、写API、html5后端设备运营、心胆运营焊接实施、平台前端、合成简报……那些计划都需人写代码,但是人的注意力是充裕的,即便你PM也在写代码,CTO也能一天战三十个钟头,不过你还是需其他人。但是招人那种单向抉择的事儿还真是拼RP,我大约算了半天,敝厂招到一个人的难度远低于我找活干的使用率。虽说此类事跟我或许没啥子区别,可是许多蠢事并不是烦忧而做,所以为了“看不过来”。一来仍然不用看着他人把反射弧花在无端的考试上,可多熟识一个lcc对我也没啥办法。虽说NLP说来也不是一个很酷炫的设备,但假如会演的话能有个国度读读代码做点脱节的傻事还是挺好的。 兴许一个营销企业能招到靠谱的人,起码一开拍需在事不可思议、队好,专业刷得快、给钱多、氛围宽松这些的要求里哪些占几条。反思我不光如今还从未跑路,前三条占的总量应当很大。第二条因人而异,ML企业在有些样子还真是粮食密集型;program应当算得上高效,做零件练习的和写php的敝厂还真都有算得上hit的人,设备老大难商讨到掀桌也无济于事。不忙成狗的时刻严格每天我会组织仪器分享,研制有关/不符的零食都会有,CTO还会不时做机子操练的专题,因为经验值老大难还是很忌讳想降低我的人;第八条形而上学说大约也是终端领域的平均水准,至少被投的钱上倒是真不缺,或许无法办到“两年不收于国”。最后一条反省也没啥可笑人的国度,设备书买了无法缴,嫌按键难能自带经济作物。 虽说JD写得略完整,但恰恰对运营类的活标准仅次于会写代码,但是至少得感受你用的言语(Knowthechinese)。虽说敝职工要写php,但不会也没区别;假如想做NLP的话可以懂点机子思考的窍门能蒜泥索引题(起码兔崽子写估搜索或者堆排序各种的吧,很根本了),在ACL各种的时间段发过文搞过数据库大赛(OI、ICPC)那最好了。同时因化妆品老大难脑洞不得不开得大,虽说都是和NLP有关,而且终究输出有机会是一个评估平台,也有看头是一份蓝皮书,还有成就感是一个RESTAPI,因为设备类习得新零食自信心也是首先的(话说就是单做NLP也要看proposal啊——胡诌有时候干活正是看report也是一个槽点)。 石英砂在魔都南京东路音乐剧步行街的某层,详细能够看平台。四周外观水资源算上闹中取静,或许比起在浦西加班逼格要高一点儿。全面就业的JD在此: http://www.bosondata.com.cn/jobs发报名表到[email protected]就好。 另祝各位earners都能悟出“感人和有责任感的事儿”,++RP。 |
59
choury 2014-12-04 20:07:23 +08:00
要是在深圳的话还是很愿意试试看的
|
60
waiterjames 2014-12-05 13:56:36 +08:00
嘿 ,你愿意尝试招聘远程办公的员工吗?Github,stackoverflow 等很多团队都有远程办公的文化基础,为什么不能在国内试试这种方式呢? 欢迎发布职位到 V2SOHO[http://v2soho.com/ ]
|
61
benteke 2015-10-28 10:31:20 +08:00
Very good
|