字体:大 中 小
护眼
关灯
上一页
目录
下一页
第243章 拔剑四顾心茫然? (第5/6页)
人们往往想到的不是依靠数据去训练。 也不是侧重于算法本身。 而是依赖于这些专家知识去训练。 这种情况下狭义知识是相当有市场的。 虽然一般的文本数据标注相比于双语互译文本标注(标注起来门槛更高)的数据其价值肯定是要打折扣的。 但在形成规模的情况下纵然是一般的标注数据一样是一笔不容小视的财富。 这种情况下似乎还是只能用技术去换钱。 仅仅是涉及到文本摘要有关的一些普通标注数据林灰估计在这个时空换取几千万美元的话完全没问题。 如果对这些标注数据加以一定包装并且足够幸运能够遇到一些识(yuan)货(da)人(tou)的话。 林灰估计忽悠个上亿美刀也是完全没问题的。 对这些标注数据加以一定的包装是什么意思呢? 严格来讲的话,同样是标注数据也是可以区分为专家标注和众包的。 所谓的“专家标注”也不是真的专家去进行标注。 “数据标注”听起来似乎蛮高大上的,但实际上呢? 进行数据标注过程往往非常复杂,涉及到数据量特别多的时候,对人工劳动力会有很高的要求。 虽然不能说低端吧,但这种机械而繁复的工作至少跟高端是没啥关系的,砖家教授肯定是不会去干这活的。 所谓的专家标注一般都是由苦逼的算法工程师进行兼职。 或者由专门的算法数据标注员进行标注。 所谓的数据标注员是一种新兴职业。 前世,随着大数据以及人工智能时代的到来,为了应对数据标注的工作在互联网上出现了一种新型职业——数据标注员。 数据标注
上一页
目录
下一页