人工智能技术在直播电商领域中的应用初探

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:zhengjunzhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:当今互联网时代随着大数据、云计算、物联网等技术及软硬件资源的积累和提升,人工智能进入了快速发展阶段。在传统电子商务领域,人工智能技术成为了助推销量增长和优化电商运营的强大推手。而直播电商的出现,使电子商务从以“产品”为核心的“图文时代”升级到了以“人”为核心的“直播时代”,再次重构“人——货——场”。将人工智能应用于直播电商,必定会对直播电商的发展带来革命性的变化。笔者从人工智能的技术要点出发,结合直播电商的特点,就人工智能在直播电商领域的应用,进行了初步的分析和探讨,旨在理清脉络,助力直播电商健康高速发展。
  关键词:直播电商;人工智能;应用初探
  中图分类号:TP311      文献标识码:A
  文章编号:1009-3044(2021)27-0147-02
  我国直播电商,最早于2016年3月由蘑菇街率先推出视频直播功能,同年5月淘宝直播正式上线,随后京东、唯品会等各大电商平台陆续上线直播功能,2019年发展进入快车道,2020年随着疫情的爆发,“宅经济”加速助推直播电商的发展,直播电商成为拉动经济内循环的有效途径。截至2020年12月,我国网络直播用户规模达6.17亿,占网民整体的62.4%。其中,电商直播用户规模为3.88亿,较2020年3月增长1.23亿,占网民整体的39.2%[1]。艾媒咨询数据显示,2020年中国直播电商市场规模达到9610亿元,同比大幅增长121.5%。预计2021年直播电商整体规模将继续保持较高速增长,规模将接近12012亿元。根据发布的数据,我国直播电商已进入全面爆发阶段。
  1 人工智能(Artificial Intelligence)
  人工智能是计算机科学的一个分支,是研究、开发模拟、延伸和扩展人类智能的理论、方法、技术及应用系统,被称作是继蒸汽机革命、电力革命、信息革命之后的第四次科技革命。发展到今日,人工智能的概念已经是家喻户晓,它不只是冷冰冰的一系列能够执行的程序,还能够自我学习,并且能做出精准快速的判断反应。目前,人工智能在一些应用领域已经能够超越人类,能完成一系列复杂的运算并且得出精确的答案。这不仅节省了人类大量的时间和精力,而且随着人工智能的普及,将给人类社会带来巨大的便利。人工智能技术领域十分广泛,在机器学习、语音识别,图像识别,自然语言处理,机器人和专家处理系统等方面的应用尤其深入。
  2 直播电商(Live e-commerce)
  直播电商,即“网络直播+电商购物”, 是指网红或其他 KOL通过视频直播、短视频等形式推荐商品并最终成交的电商业态。在电商直播间,主播以销售商品或营销品牌为目的,以直播作为媒介,对产品进行全方位的介绍和试用,给用户传递商品价值,让用户可以直观、全方位地了解所售卖的产品,提升购物体验。直播电商是内容电商的升级,它兼具内容电商和社交电商属性,其本质是通过直播为电商带来流量,从而促进电商销售。与传统电商相比,直播电商在产品呈现形式、社交属性和购物体验等维度都有显著的优势,具有高互动性、娱乐性、可视性、去中心化等特点[2]。
  3 人工智能技术在直播电商领域的应用
  3.1 AI虚拟主播
  人工智能驱动的虚拟主播可以有力提升直播电商的社交性,并有效突破原有网红和KOL在时间和空间上的限制,具有更高的可塑性和复用性,能为品牌创造更多定制化和个性化的内容,成倍提高生产力,最大化边际效应。根据每位主播的人设,性格,爱好,形象、语言风格、肢体风格等,开发属于自己的AI虚拟主播形象,进行专业的人格化运营,在主播下播后可以继续服务粉丝,打开新的流量场域。品牌方可以同时、多地、多场景地使用AI虚拟主播,内容延展性大幅提升,MCN机构也可以尝试 打造AI虚拟主播IP。虽然AI虚拟主播看起来只是一个3D动画,但背后是人工智能领域最复杂的技术应用,包含了声音、语言、文字、图片、动画、商品等众多要素,结合了表情捕捉、动作捕捉、物理解算、同步传输、特技效果等专项技术,实时识别并理解互动的内容,并做出实时反应。阿里巴巴达摩院资深算法专家陈海青认为,一个成功的虚拟主播需要四个方面的技术架构:感知与认知、导演系统、3D建模、3D素材库,不但要为虚拟主播设定情绪,还要设定相应的肢体语言,包括嘴型、四肢等。
  3.2 语音合成与语音识别
  如何让AI虚拟主播像真人一样“口吐金莲”是一项极为复杂的技术难题。Google的DeepMind研究实验室发布的WaveNet,是第一个用神经网络生成人类自然语音的。Wavenet模型主要成分是卷积网络,每个卷积层都对前一层进行卷积,卷积核越大,层数越多,时域上的感知能力越强,感知范围越大。在生成过程中,每生成一个点,把该点放到输入层最后一个点继續迭代生成即可。2018年,由 Lyrebird公司开发的“语音合成”技术,不仅能利用语音演算模仿出任何人的声音,还能在声音中加入“感情”元素,让声音听上去更为逼真。背后依赖的技术正是神经网络和机器学习。
  对于消费者,语音搜索要比手动输入文字来得更便捷。直播电商平台通过采用语音识别技术可以高效地向消费者推荐其所想要寻找的视频、主播或商品。语音识别技术目前相对已经比较成熟,有不少支持NLP和语音输入的AI系统,如亚马逊、京东、淘宝等平台都已经上线此项功能,用户反馈很好。
  3.3 美颜算法
  如今,无论是用手机拍照、拍短视频,还是一些社交平台,都离不开美颜SDK,直播电商也不例外,要想呈现出自然优质的美颜效果,最重要的便是人脸识别技术。人脸检测技术可以实时检测出多张人脸,并且精准定位画面中的人脸位置并获取相关信息,自动识别出人的五官轮廓,实时识别面部表情动作,包括睁眼闭眼、张嘴闭嘴、挑眉、点头摇头等表情姿势,以及人脸的检测、分析和比对。通常使用双边滤波算法和平滑滤波算法来实现美颜SDK中的磨皮和美白两大基本功能。需要经过高反磨皮或者是双曲线磨皮算法对人像进行磨皮,结合皮肤区域从而得到精确磨皮的效果。除了基本的磨皮算法,调整肤色也是至关重要,不仅需要实现美白红润的效果,还需要控制肤色。   3.4 情感引擎
  情感AI,被誉为人工智能的下一个春天。通过创建一种能感知、识别和理解人的情感,并能针对人的情感做出智能、灵敏、友好反应的计算系统,包括情感信号的采集、分析、是一个高度综合的研究和技术领域。通过解析消费者在直播电商平台中的互动内容,对消费者的情感和行为进行分析,对积极的情绪加以引导,对消极的情绪及时安抚,从而更有效的服务对消费者。1995年情感计算之母Rosalind W.Picard 首次提出affective computing,研究的目的是使得情感能够模拟和计算。这个技术可以让机器人能够理解人类的情绪状态,并且适应它们的行为,对这些情绪做出适当的反应。Picard领导的美国麻省理工学院多媒体实验室近年来提出了50余种情感计算应用项目。在课堂教学、医疗康复、情感检测与舆情监控等方面展示了情感计算的有效应用,相信不久在直播电商领域也会有相应的应用[3]。
  3.5 机器翻译
  机器翻译是利用机器的力量,自动将一种自然语言(源语言)翻译成另一种语言(目标语言)。基本过程分为原文分析、原文译文转换和译文生成三个阶段。神经网络的问世,同人类一样具有了一些学习能力和变化能力,能在相对动态的处理语言规则、表达语言逻辑和含义。直播场景的翻译任务很复杂,它需要先后进行语音识别和翻译两个过程,并要克服口音不标准、口语化表达、直播环境嘈杂、商品专业名词多、新品新词更迭快等问题。为解决机器听不清、听不懂的问题,达摩院研发出了更智能的语音模型,不仅可以实时翻译直播内容及评论区的小语种语言,还可在嘈杂的环境中“听清”直播内容;同时,在AI翻译任务过程中创新性集成了视觉信息的识别结果,可将口语化句子改写成正式表达句子;此外还能举一反三,无须重新训练便能快速学习不同场景里不断更迭的专业名词。2020年10月21日,阿里完成全球首个多语言实时翻译的电商直播,该直播展示了AI无惧嘈杂环境、口音不标准及口语化语言风格等问题,实时将中文直播内容精准翻译成英语、俄语、西班牙语等语言。跨越语言障碍,配备实时翻译功能的24小时全球直播成了去年双11速卖通的最大亮点之一。
  3.6 AI智能推荐
  直播电商具有“轻搜索重推荐”的特征,智能推荐引擎能够实现“货找人”而非“人找货”,帮助用户快速找到自己喜欢的直播内容和所需要的产品,实现“一人千面”的效果。智能推荐功能包括:基于搜索、已购和浏览记录的兴趣推荐,包括相似品、互补品算法,高低频等等;基于用户访问时间的活跃性推荐,根据时间推测用户可能的使用场景做出推荐;基于位置信息的推荐,检查用户是否处于线下商圈,是否需要推荐店铺;基于社交属性的推荐,根据好友关系、社交行为等,猜测用户可能需要的商品。智能推荐功能的实现依赖于背后的推荐算法,主要包含协同过滤推荐和基于内容的推荐。前者是从集体智慧出发实现推荐,把用户的消费行为作为特征,进行用户相似性或物品相似性的计算,进而实现信息的匹配。后者则更强调对文本内容进行解析,通过不断的意义抽取和指标细化,为文本打上无数标签,用不同的标签集来对内容和用户进行标注,向用户推荐与历史内容项目相似的信息。
  3.7 智能聊天机器人
  直播电商相比传统电商最突出的特点之一就是实时互动性。智能聊天机器人的聊天对话是基于机器学习的算法,消费者可以通过文字、图片、语音甚至表情包和机器人沟通交流,通过个性化的方式与消费者沟通聊天,不仅能够对顾客提出的问题进行解答,还能帮助顾客挑选商品,以及相关的服务流程。
  3.8 直播内容审核
  直播过程中一些主播为了吸引眼球、推销商品容易做出一些违规的事情。内容风险监控是直播电商面临的一个重要的课题,技术挑战非常大,管控难点主要包括主播行为、直播内容不可控、业界缺乏成熟方案和标准、对算法的高实时响应要求等等。通过大量采用人工智能技术,配合优化后的高性能多媒体计算集群,大幅度降低人工审核成本的同时,提升了对内容风险的防控能力。基于深度学习算法构建的多层视觉感知机,采用改進的Inception神经网络层以及多模型级联,实现了快速识别多尺度色情内容。
  总之,人工智能技术不仅在直播电商上述领域发挥重要作用,而且在智能动态定价、虚假交易监测、过滤虚假评论、粉丝管理、内容制作、数据管理等方面都将扮演重要角色。人工智能在直播电商行业中应用越来越多,各大电商公司也将继续改进其AI工具,以更好地满足市场需求,构建出更人性化更高效的解决方案。我们相信,人工智能必将成为直播电商发展的重要助推力。
  参考文献:
  [1]  CNNIC.第47次中国互联网络发展状况统计报告[EB/OL]. [2021-02-03].
  [2]  艾媒网.直播电商年度观察:2021年市场规模将破12000亿元,带货主播强者恒强[EB/OL].[2021-01-28 ].
  [3]   Bilibili.阿里技术:淘宝直播在冲刺最复杂的人工智能技术[EB/OL]. [2020-11-12].
  【通联编辑:李雅琪】
其他文献
"1+X"证书制度是我国职业教育的重大创新,必将为我国职业教育教学管理模式带来变革。在"1+X证书"背景下,湖南大众传媒职业技术学院数字媒体技术专业立足湖南、面向全国,从数字创意产业中的数字媒体技术岗位对"技术技能培养""艺术设计素养"和"职业核心素养"三个方面需求出发,遵循"厚基础、宽岗位、活技能"的要求,将"1+X"证书的考核标准与本校数字媒体技术专业的课程相结合,吸纳数字媒体新技术,搭建三位
随着信息技术的迅猛发展和智能手机的快速普及,“抖音”“快手”“西瓜视频”等平台的“三农”短视频呈现出越来越丰富的乡村风貌、农家生活、乡土文化等内容.现在我国广大农村已基本实现了脱贫,但乡村振兴任务依然任重道远,“三农”短视频的蓬勃发展无疑为助推乡村振兴战略实施提速增效.该文对“三农”短视频发展传播过程中存在的问题进行分析探讨,并从创作者、运营者及平台三方面提出相应的对策,以期为“三农”短视频更好地发展提供参考依据.
为实现对车间内生产环境信息进行实时的监测以及远程的管理,设计基于物联网的智能车间生产环境监测系统,利用无线通信技术以及传感器设备可对车间生产环境进行实时的检测以及反控制操作,系统依据物联网架构设计,通过Zigbee和RS485技术将实时采集空气温湿度、二氧化碳浓度、光照强度和PM2.5等环境参数传输至边缘网关根据通讯协议进行解析处理后再上传至云端进行存储,基于云服务器实现业务逻辑管理功能,建立数据
摘要:路灯作为城市建设中基础照明设施,在人们的日常生活中起着不可或缺的作用。随着城市的快速发展以及社会的进步,绿色、环保、可持续成为社会的发展口号。然而在现实生活中,城市路灯等照明设施存在照明质量低、照明投入大、设施管理成本高等问题。为持续推进城市照明工程的科学、绿色、节能发展,针对上述现存问题设计一款新型的智能路灯控制系统具有十分重要的现实意义与价值。在对道路照明的时候,一方面要尽可能地节能,其
颜色是物体的一种重要特征,人们可以依据颜色对物体进行分类、判断等。颜色识别很大程度上改变着人们的工作方式。使用计算机对颜色进行识别,可以极大地提高工作效率,降低工作成本。本文就opencv中使用HSV模型对红色识别过程中存在的识别不准确、不全面的情况进行了分析并提出解决方法,并在实践中加以验证。
摘要:随着医疗体系的不断完善,医院诊疗服务等方面也在不断优化和进步,因此对医院后勤综合管理提出了新的需求。医院的后勤综合管理能力,关系到医院各项事务的运行效率和质量保障。本文从医院后勤智能化综合管理平台优势作为切入点,从后勤平台管理框架和平台功能模块两方面详细分析了后勤智能综合管理平台的建构,最后对后勤智能综合管理平台的前景进行展望,以期对医院的现代化改革和智能化发展起到抛砖引玉之功效。  关键词
针对三极管放大电路分析过程比较抽象的特点,利用Multisim仿真软件完成对三极管基本共射放大电路静态工作点的选取、直流分析、动态分析,直观地展现三极管放大电路的工作原理;应用Multisim温度扫描功能,评估基本共射放大电路工作性能静态工作点的温度漂移以及温度对输出波形的影响,同时展示了具有负反馈作用的分压式偏置放大电路输出波形基本与温度无关的特性.
对于视频场景中的一些异常行为(暴力行为)识别技术,本文重点研究深度学习邻接层间的度量机制和跨层学习方法,建立深度暴力特征网络框架,以及研究基于改进的稀疏表达分类的检测框架,实现进一步提升识别能力并达到实际监控应用。
Bootstrap框架常被用于响应式网页设计,是一款优秀的前端开发框架.Bootstrap框架以LESS为基础,应用了包括HTML、CSS、Javascript、jQuery等多种技术来实现移动端响应式Web的开发,其本身在简洁灵活的同时又具备了强大的可拓展性,因而能够在响应式Web设计中得到充分应用.基于此,该文将围绕Bootstrap框架在响应式Web设计中的应用展开分析.
信息时代各种新兴技术得到空前发展,计算机网络技术进入高速发展阶段,智能化图像处理技术被广泛应用到人类生活中。随着计算机图像处理技术应用领域不断拓展,人类对该技术的应用也逐渐成熟。本文通过简要分析计算机图像概念和分类,为研究图像技术在不同领域应用提供依据,并深入探讨图像处理技术在各方面的应用,希望能够提高计算机图像处理技术应用效率。