2018年百度AI行业分析报告
图表 17 百度视频内容分析功能
资料来源:百度 AI 开放平台网站、
3、认知层:自然语言处理是技术基石,用户画像能力得天独厚
? 自然语言处理:核心技术行业领先,赋能新搜索生态 自然语言处理(NLP)是搜索引擎的技术之本。百度研发了多种 NLP 技术,包括语义理解、内容标签、情感分析、
文本生成、摘要、深度问答、机器翻译和对话系统等。这些技术广泛应用于百度的搜索、信息流、智能助手等产品 中,为数亿用户提供服务。搜索引擎是 NLP 技术最大的用武之地,搜索引擎最基本的模式是自动化地聚合足够多 的内容,对之进行解析、处理和组织,响应用户的搜索请求找到对应结果返回,这其中每一个环节都离不开自然语 言处理技术。
除了对 NLP 技术本身的研究,百度还将这些技术集成到统一的平台——NLP 云,从而为百度各种产品提供服务支持。 百度开发的 NLP 云平台拥有 20 多种 NLP 模块,每天的请求数量超过 1000 亿次。
图表 18 百度自然语言处理技术体系结构图
资料来源:雷锋网、
2018年百度AI行业分析报告
自然语言处理具有三种常用的应用系统,包括图像问答系统、机器翻译系统和对话系统。目前,百度翻译已可支持 全球 28 国语言、756 个翻译方向之间的互译,每日翻译次数达 1 亿以上。截至 2017 年初,百度已经为超过 2 万个 企业和开发者提供百度翻译 API,让他们提升自己的产品功能,为用户提供更优质的服务。
图表 19 百度神经机器翻译(NMT)系统
资料来源:雷锋网、
图表 20 百度多轮交互对话系统
资料来源:雷锋网、
? 知识图谱:用“知识”连接世界,创造智能应用
知识图谱技术包括知识的获取、组织、运用和传承等,这将是人工智能核心基础能力。目前百度的实体图谱已经包
2018年百度AI行业分析报告
含了数亿实体、数百亿属性和千亿关系,这些都是从大量结构化和非结构化数据挖掘出来的。知识图谱能够对各类 应用进行智能化升级,为用户带来更智能的应用体验,知识图谱已经在百度的生态中展现实力,智能问答、相关推 荐和信息流推荐、百度度秘、百度汉语和智能提醒中均融入知识图谱技术,让用户体验获得极大提升。知识图谱还 在百度各个产品线发挥作用,包括百度地图、百度金融、百度教育等。知识图谱开放平台也已上线,可接入数据引 入和数据抽取两项服务。
图表 21 百度知识图谱技术应用
资料来源:百度、
? 用户画像:“亿人亿面”——十亿用户画像、千亿级标签
用户画像是基于百度大数据、机器学习获得的能力,每天使用百度系产品的用户累积超过 10 亿。用户行为构成了 用户画像能力的数据基础;百度大脑的高精度模型对百度 80 多条产品线,以及合作伙伴的数据进行分析挖掘,得到 千万级别的用户标签体系,并且根据用户不同的行为特点贴标签、绘制画像。百度已有接近十亿的用户画像,对于 用户的识别可以细分到 1000 万级细分标签。
图表 22 百度可根据用户不同的行为特点贴标签、绘制画像
<