字体:大 中 小
护眼
关灯
上一页
目录
下一页
第254章 风起赫尔辛基(5) (第4/5页)
电子邮件,日志和文档。 第二种类型是非传统数据。 这包括未标记的音频和视频文件、静止图像和声音文件。 第三种类型是深度数据。 这包括深层网络中搜索引擎无法触及的信息。 这些深度数据大多是私有的,由政府或私人机构控制。 它包括由学者、政府机构和当地社区策划的数据、医疗记录、法律记录、财务信息和组织特定数据库。 以上这些数据都可以称之为暗数据。 暗数据这类数据虽然相比传统意义上数据虽然要更隐晦一些。 暗数据这种未标注过的数据虽然不能拿来直接用吧。 但却不能否定这种东西的潜力。 反正绝对不能说这些信息不重要。 至于果子为什么对这类东西感兴趣。 因为收集这类一贯不被视为数据的数据。 实际上通过深耕是能得到跟传统数据差不多的功效的。 而且使用这类数据的话,通过一些概念性的教育消费者甚至可以形成一种企业从来不涉足一般数据的印象。 这对于树立企业形象岂不是很有妙用?? 总之,对于既当又立的企业不能说是没有诱惑力。 反正林灰觉得从暗数据入手这倒是符合很多科技巨头的行事风格。 类比林灰以前估量的价格。 如果说几千万美元就能买上千万条双语标注数据。 可想而知像蘋淉所谋求的价值两三个亿美元的暗数据肯定是一笔相当庞大的数据。 涉及到标注数据跟暗数据一大区别在于标注数据
上一页
目录
下一页