2024 年腾讯全球数字生态大会
亮点:今年发现腾讯双语的同传软件。友情提示伙伴们,当作入门级别认知。
01 如何处理每天数十亿次攻击?
腾讯安全部副总裁 董志强 作分享。
分享者讲述这样一个故事,今年 7 月 21 日发现某个软件 0 漏洞,风险系数高,而且容易被利用。团队 1 小时内评估受到影响的服务器,立即开展行动写防护规则、检测规则,30 分钟之后,就捕捉到受到影响的服务器。
目前,部门认知的行业平均数据,攻击次数每天 50 亿次,看得见的高风险时间 800 多起。这样的网络环境之下,团队 4 分钟就找到了结论,即知晓对方如何攻击,解开手法之后,找到一些比较简答的攻击方法,虽然简单,但案件数量很多,因其数量规模不可忽视,对整个安全部门,提出了挑战。
这个案例也说明,目前搞云业务,以及与其相适应的网络环境,从确定安全技术领域,到新的安全风险面识别的转变,因此技术方面就要跟上攻击方法,以及其他漏洞或者信息泄露环境。那么,这样的情况,实质对一些硬件上的安全管理,提出了新的要求,不同供应商也产生管理风格的分歧。
评注:具体什么分歧没有展开,如果是讲座的话,更多是发展方向上的分歧。
02 分享主题:IDC AI与数据
非关系型数据库焦点是什么? 实时分析,向量数据库,半结构化和非结构化数据。RED,GenAI(生成式AI,近几年很流行且逐步提上使用的)。
下一代的数据库展望
聚焦于以下工作
数据安全、数据治理、业务层面数据、AI治理,这些都是可控的部分。
还包括风险审核、图像数据库(之前李飞飞自传提到的 ImageNet,就是一类),跨数据库的半结构化、结构化数据存储、使用。以及基础数据的自身治理能力。
本土的数据库怎么使用?
金融行业方面,诸多数据库应用,正在逐个验证。
评注:这类验证模式,我相信指标应该是比较简单直接的。依据行业自身特点,梳理关键绩效指标,效率指标。进行检验,新上线的数据库是否提升了效率。
关于数据治理
数据治理(Data Governance)是组织中涉及数据使用的一整套管理行为。由企业数据治理部门发起并推行,关于如何制定和实施针对整个企业内部数据的商业应用和技术管理的一系列政策和流程。
数据治理目的
* 降低风险
* 建立数据使用内部规则
* 实施合规要求
* 改善内部和外部沟通
* 增加数据价值
* 方便数据管理
* 降低成本
* 通过风险管理和优化来帮助确保公司的持续生存
摘自阿里云。
关于 AI 治理
1.元数据管理。 在传统的元数据管理中,对于非结构化数据的元数据采集 通常是
通过创建非结构化数据的搜索索引的方式。而语音识别、图像识别、文本分析等人工智能技术能帮助实现元数据的最初业务词库的构建,成为提取各类有价值的非结构化元数据的资源池。
2.数据标准管理 对存量系统的数据库字段进行摸底,识别出共有的、重复使用的业务字段,作为建立数据标准的依据。如果完全靠人工梳理,需要协调各业务部门大量人员参与,工作量巨大且容易出错。借助机器学习、自然语言处理技术,可以根据字段业务名快速的整理出高频词根,将可能需要几个月的工作在几天内完成。数据标准管理的另一个重要环节是标准与元数据的映射,很容易出错。
3.数据质量管理 理想模式是
从数据源头剔除脏数据,但是在现实中并不可行。因此,根据业务期望,应针对性地提升各个业务阶段的数据质量。机器学习(如分类学习、聚类、回归等)可提取并识别存在的质量问题,从而
制定有效的数据质量评估指标,最大化实现该指标下的数据质量的提升。同时,监督学习、深度学习也将实现对数据清洗和数据质量的效果评估,进而改善转换规则和数据质量评估维度,并随着数据量和业务期望的逐渐变化,使数据质量提升方案动态更新。
评注:数据和标准都 AI 化了,解释了为什么 AI 比你更了解你自己。
4.数据安全 数据安全是指让信息或信息系统免受未经授权的访问、使用、破坏、修改、销毁的过程或状态。人工智能技术可以进行敏感数据的分类分级。例如,利用数据分类引擎在邮件内容过滤、保密文件管理、情报分析、反欺诈、数据防泄露等领域明显提升了安全性。
5.主数据管理 主数据指企业核心业务实体的数据,也叫黄金数据,是在整个价值链上被重复、共享应用于多个业务流程的、各个业务部门与各个系统之间共享的基础数据,是各业务应用和各系统之间进行信息交互的基础。
6.人工智能自动识别主数据 确定主数据依赖于企业对于业务需求的理解和相应“黄金数据”的定义。通常来说,
每个主数据主题域都有自己专用的记录系统,并且分散在各个业务系统中。
7.人工智能帮助重复数据自动匹配和合并 主数据管理面临的一个挑战是在企业众多的系统中对于同一数据项或者重复的数据项进行匹配和合并,解决该挑战的一个方法是构建数据匹配规则,包括不同置信水平的匹配接受度。机器学习、自然语言处理可
帮助建立重复数据识别的匹配规则,在识别字段重复的主数据之后不进行自动合并,并确定与主数据相关的记录,建立交叉引用关系。
来自
知乎。
03 全栈自研助力企业数智化转型
数据库三个不可能: 通用、成本、性能。
腾讯云数据库的解决方案:
单一引擎 - 多引擎一体化 - 服务交付。注意,这里交付的是服务,降低了服务提供者的门槛,这是云时代的特点,更多开源、更多开箱即用、更多内部紧耦合,降低了很多行业外学习者的难度。
该公司提供端到端的解决方案,交付服务,并非软件或者安装包。
腾讯云数据库,基于不同场景,使用向量数据库。
关于向量数据库
开发 ChatFiles 和 VectorHub 两款开源项目,用到 向量数据库(Vector Database)。主流的向量数据库和搜索算法,包括向量数据库的基本概念、相似性搜索算法、相似性测量算法、过滤算法和向量数据库的选型等。
对于传统数据库,搜索功能都是基于不同的索引方式(B Tree、倒排索引等)加上精确匹配和排序算法(BM25、TF-IDF)等实现的。本质还是基于文本的精确匹配,这种索引和搜索算法对于关键字的搜索功能非常合适,但对于语义搜索功能就非常弱。
如果你需要处理非结构化的数据,就会发现非结构化数据的特征数量会开始快速膨胀,例如我们处理的是图像、音频、视频等数据,这个过程就变得非常困难。例如,对于图像,可以标注颜色、形状、纹理、边缘、对象、场景等特征,但是这些特征太多了,而且很难人为的进行标注,所以我们需要一种自动化的方式来提取这些特征,而这可以通过 Vector Embedding 实现。
B-Tree:B 树特点,是 NODE 内部还有子树。点击阅读《
一个案例看懂红黑树》。
倒排索引:Elastic Search,
倒排索引是一种用于全文搜索的数据结构,它将文档中的每个单词映射到包含该单词的所有文档的列表中,然后用该列表替换单词。因此,倒排索引在文本搜索和信息检索中广泛应用,如搜索引擎、网站搜索、文本分类等场景中。
BM 25:BM25是一种用于文本信息检索的算法,是BM(Best Matching)系列中的一员。它在信息检索领域中广泛应用,特别是在搜索引擎中用于排序搜索结果。整体而言BM25 就是对 TF-IDF 算法的改进。
TF-IDF:词频 TF,Term Frequency,衡量一个term在文档中出现的有多频繁。逆文档频率IDF:Inverse Document Frequency,用于模拟在该语料的实际使用环境中,某一个term有多重要。TF-IDF与一个词在文档中的出现次数成正比。
04 互联网 Severless
潘安群 腾讯云数据库总经理
TDSQL 建立,再搭建 SaaS 产品。
风格:
1.不同引擎的数据传输的聚合;
2.快速问题定位,创造内部 DataBase Brain,出具完整的解决方案,提升服务性能。
3.AI Severless,提升性价比,主要通过增加业务弹性的模式。具体体验,就是依据业务方案确定负载量,从而降低成本。降本的思路,很大程度依赖于弹性。该项措施,效果是成本降低 50%,延迟降低 80%。
4.互联网场景 Severless 应用。开发需求策动的资源,达到快速伸缩是效果。
双轨并行应用场景
数据迁移时候用到,例如,海外数据迁移国内,使用的是多轨并行。目前这些技术应用,从中小行,应用到大行。
如果存储方面,在芯片的预算有限,用软件弥补这块。当然,系统上的性能也要提升。
案例-1:中国农业银行,其数据是双轨转向单轨。使用腾讯 TDSQL,其实这块数据迁移,更多用的是他们工程师的技术能力,其实专业服务可能才是重点。
这些具体工作,比较简单地理解,即不改应用,底层无感替换,无需业务团队投入资源。
快速替换方面工作,目前是 1 个月替换,即替换系统。
综上所述,目前一家国有银行级别想换掉数据库,工期基本也就是 1 个月,使用 TDSQL 的话。
关于 Severless
提供一种用户对服务器不可知的服务。在Serverless架构下,开发者只需编写代码并上传,云平台就会自动准备好相应的计算资源,完成运算并输出结果,从而大幅简化开发运维过程。
关于 TDSQL
分布式数据库TDSQL是腾讯打造的一款企业级数据库产品,具备强一致高可用、全球部署架构、高 SQL 兼容度、分布式水平扩展、高性能、完整的分布式事务支持、企业级安全等特性,同时提供智能 DBA、自动化运营、监控告警等配套设施,为客户提供完整的分布式数据库解决方案。摘自腾讯官网。
05 昆仑万维
昆仑万维董事长兼CEO 方汉
参与者:
吴晓波 财经作家,巴九灵新商学、蓝狮子出版创始人
汤道生 腾讯集团高级执行副总裁、腾讯云与智慧产业事业群 CEO
刘向阳 美的集团CISO兼软件工程院院长 欧洲科学院院士、IEEEFellow和lET Fellow
方汉 昆仑万维董事长兼 CEO
目前,昆仑万维在 100 多个国家,有 20 多家办公室,在波兰和挪威都有驻点。
一开始企业是自己出海,带业务到海外。后来采取的是“借壳出海”,例如,收购 Opera,Gerinda, StarMaker。其中 StarMaker 目前有 4 亿月活。
目的也比较简单直接:一是税收的优惠;二是市场拓展。
汤道生等人,介绍了腾讯会议海外的应用。
圆桌有说到,海外平台,相较于国内平台,要注意什么?
合规方面,可能是个挑战,并非金钱是一切。分享者说到,非洲就是很喜欢向中国企业收钱的新兴之地。这种感觉,可能很像那种集市对外国游客有一套专门的“话术”一样。
通常出海准备,一是了解当地税法和监管,要拿到资质。二是非洲法律对标欧洲,东南亚法律对标中国,研究透当地法律,干合规的事情。
关于昆仑万维
昆仑万维成立于2008年,2015年登陆深交所,目前旗下业务覆盖 AGI 与 AIGC、信息分发、元宇宙、社交娱乐及游戏等多个领域,市场遍及中国、东南亚、非洲、中东、北美、南美、欧洲等地。截至目前,全球平均月活跃用户近 4 亿, 海外收入占比达 88%。
06 元梦之星的战斗服方案
分享者 孙飞虎,元梦之星运营负责人。
这位分享者分享的是,大规模集群快速发布。关于这一点,针对游戏服务器。
业务特点:
一是所谓“一键发布”,过百万核心集群。
二是更新个别 NODE,做到 30 分钟更新完毕。其中,NODE 镜像缓存、预热全部事先存于 NODE,提升启动速度。启动时候,可能有同步镜像的过程。这种方案,可以做到 2 分钟内同步完,并且效率提升 90%。
三是如何做到资源优化、快速发布、快速扩容 100 多万核心的 NODE。难点在于,
(1)大规模规则上下架;
(2)“房间”(未确定该词含义)数据过百万,40000 多规则,需要新的维护方案,Ingres 方案,向配置中心拉取配置,全自动完成也就 10 分钟。
关于战斗服的版本管理
第一,版本节点缓存。新机器部署、扩容,约为 50-60G 文件,存于一个 NODE。新战斗服,也存于一个 NODE。这些需求使得流量压力很大,如果不干任何事,完成时间是 40 多分钟。目前,团队提出解决方案,即云 CFS 优化,拉取需要部分战斗服,提升云硬盘效率。做到 6 分钟便完成操作。
第二,上线难。我文件约为 120T 量级,3000 多个加速 NODE,160T 带宽,这样的数据就可以开服了。
第三,实时监控。可以做到 5 分钟扩容、缩容,20 分钟变更(配置),10 分钟做到 40000 规则上下架。只要 1 天的时间,就能过百万核心上下架。
第四,上线 9 个月无故障。
CFS 优化:Completely Fair Scheduler,是 Linux 一种进程调度算法。
Ingres :Ingress 公开了从集群外部到集群内 services 的 HTTP 和 HTTPS 路由。 流量路由由 Ingress 资源上定义的规则控制。
06 Unity 手游还是小游戏
掌趣科技的胡传栋,作分享。
1.Unity 做小游戏好处。
降低开发时间。例如,掌趣的3D游戏 《塔防纪元》用的 Unity。目前手游也会选择 Unity。
2022 年,《塔防纪元》在华为排行榜上,获得华为最佳游戏。微信小游戏也上线,这里分享者说,Unity 应用主要因为功能完善,可以支撑目前,手游或者小游戏开发。然而,我们都知道,端游和手游各种差距还是挺大,特别是体验,以及开发成本(ShoelessCai 评注)。
比较各种模式,可以基于端游或者手游的代码(已经形成的),转成小游戏,再进行一些性能调整(个人理解,做一些更适应于微信开发环境的调整)。
专业术语。
游戏开发方面关注的指标:同频率。
这个指标,掌趣是依据大游戏的标准,进行优化的。举个例子,如果游戏占屏比较多,卡顿率必然会增加,而且内存占用率也很高。如果你要上线 iOS 的话,还有内存限制,這些在开发过程中考虑到,会省很多成本。
举个例子,掌趣的大胜顶住。
待展开。
再举个例子,《塔防纪元》同频点 200 个,掌趣做的工作,就是减少同频点,保住性能。
比较注重小游戏的启动速度(很关注用户体验了)。使用的工具我列举一下。
C#,华佗,图片尽量 PNG 压缩(这个我也深有体会,PNG 最适用,适当可以做页面精简)。
数据如何分页,他们也作了分享,用三种解析模式,这样的话,灾备和速度都是有所支撑。
压缩技术,序列帧。
帧率提升 18% 的时候,会降低 100M 的内存。我们姑且认为帧率这个指标,是一帧画面含有的信息量。
渲染,用的 Render。
关于 Unity
致力于满足中国开发者的独特需求,结合本土文化元素和市场特色,为创作提供全面支持。一款游戏引擎,有专门针对小游戏的解决方案。
关于 华佗
香港中文大学(深圳)和深圳市大数据研究院所在的王本友教授团队训练并开源了一个新的医疗大模型 ——HuatuoGPT(华佗GPT),以使语言模型具备像医生一样的诊断能力和提供有用信息的能力。
Render
Render 函数是 Vue2.x 新增的一个函数、主要用来提升节点的性能,它是基于 JavaScript 计算。使用 Render 函数将 Template 里面的节点解析成虚拟的 Dom 。
07 新传媒 SuperAPP and SuperIP
孙旭 腾讯云传媒作分享。
这段介绍主要关于 SuperAPP 和 SuperIP 处理方法。
北极星指标是什么?
理论上,
客户端日活、人均用时、端外日活。最终是关注到效益上,怎么衡量呢?
针对传媒业务,数据库运营、运营策略还是挺重要的。目前媒体行业可能就是缺乏运营策略,于是,这些任务可能就会让领导承担。
腾讯云传媒也会提供相应服务,也是类似咨询业务。有几个目标,一是提升运营思维;二是针对内容和用户的数据分析。例如,客户分层,同样的用户打开同样的新闻客户端,每个用户被推送的内容都是不一样的。这个时候,了解用户这件事就变得很重要了。其他的,还包括夯实底层数据,将数据分析结果,应用于产品运营。
更多地是围绕着“用户消费了什么”这个议题,显示用户全链路的状态。
传媒业务还有一个目标,就是私域流量。这几年是老生常谈这个问题,更类似于对用户进行分析、连接,找寻社群的关键点。这个关键点周围一切资源,就是我们所谓的私域流量,这个概念是相对于“全域”而言的。对于腾讯媒体,针对其全网而言,全域流量,其实是 10 亿流量。原来在全域流量上做的事情,现在完全可以放在私域流量上完成。
媒体的私域举几个例子。一是帮助媒体建立私域社群;二是原来的全网流量全部为媒体,现在可以分拆出电商流量,去发展私域。三是私域场景应用,例如大健康、文旅之类。这种业务都是和 B 端合作,提供解决方案。例如,腾讯视频,腾讯视频方案是分池,全链路 NODE 都有一个池子和 NODE 对应。
暂时这么理解吧!
关于腾讯传媒的 SuperAPP
原则,先自用,再陪伴式成长。举例,例如,北京一教师,通过腾讯传媒业务出售其课程,定价是 5000 元一个课程,出售了 5000 份。这些其实都是依托于平台,创造业务的案例。
这里要注意一个概念的更新,腾讯提出“智能体”的概念。更像独立模块,所谓“智能体”,可以达到块与块之间松耦合,块内紧耦合的效果。
原来所有的传媒,包括电商,使用网上的资料的时候,基于内容的。现在的模式,基于智能体。这样的话,更加平台化,还能聚合地方性的特点。换言之,智能体不提出来,地方性特点未必明显。
关于 SuperIP
原则是,如果有好的 IP,腾讯就会致力于保护版权,业务模式就是通过 SuperIP 方式。换言之,共同 ToC 方式。例如,音乐 + AIGC + 地方内容。都是很有潜力的创作方向。
关于智能体
一是基于小程序迭代。二是 SuperIP 的资产管理。包含资产管理、资产保护、资产交易、资产应用、资产增值。
从媒体到电商
第一,并非 MCN 解决方案,而用的是电商工具,例如,基座、聚合支付结算。
这里的电商工具,举个例子,政府消费券,原来可能直接和微信、美团合作(集中分发)。现在供应商可以基于自己的基建系统,进行政府级别券的发放。然而,很多客户其实也在这么干。
亦或是其他应用案例,例如,健康科普智能体,那种 BToC 的连接器,也是客户。
第二,媒体应用。
切入点包括内容、产品、策略、创新,每个指标都不一样。
2.关于 Agent,应用媒体。例如,短视频,现场实时互动的内容。
腾讯云 Agent:数据安全审计部署的核心目标是把 Agent 安装到数据库服务器或访问数据库的应用服务器中。
08 什么是架构优化?
光宇在线系统管理的 范赟鹏 作分享。
什么叫做架构优化?
从用户访问 API,一直到返回数据的链路:逐层分解 - 拆解 - 程序中间件 - DB - 分而治之。
1.程序中间件,分布式。
2.结构化,模块化。
3.定期压力测试,自动化。
4.缓存,读写分离。
5.降低业务、服务,提升容灾能力。

ClickHouse 生态到研发处理,反复处理,快速判断。
运维、规范、自动、平台化、智能化。
其中,平台化。一键启动,集中管理。智能化,更多应用于大数据,不仅仅是运维。将问题前置,针对突发条件处理,若非平稳情况(例如,内存占用增加,GC 回收增加),就前置。
团队管理
一是故障复盘,针对故障反复总结,提升流程,提升快速恢复。还有每周价格迭代。
二是业务风险复盘。内审业务如何提速,如果聚焦于成本,那么就得提升系统性能。
三是人才梯队,保证替换率。
提到 SLA 保障承诺。

ClickHouse:ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。
SLA 保障承诺:SLA(service level agreement)服务等级协议,指的是整个协议,其定义了服务类型、质量以及赔付标准等。SLO(service level objective)服务等级目标,指的是设计可用性,其意思即为设计该产品时期望达到的可用性目标。
SLA(Service-Level Agreement),也就是服务等级协议,指的是系统服务提供者(Provider)对客户(Customer)的一个服务承诺。这是衡量一个大型分布式系统是否“健康”的常见方法。常见的四个SLA指标,可用性、准确性、系统容量和延迟。
08 实时传媒要求
腾讯智慧传媒架构师 谢义 作分享。
1.关于视频加密,使用的是 AI 技术。
2.实时音频视频传输,保证低延时、稳传输。
例如,
央视电竞云转播。结合实时音频视频,AVS3-P10,实时音频视频。
流媒体对网络要求稳定,跨境视频有多少种方案?
云网络传输、海外分架、云平台。
流媒体套件 StreamLink, StreamLive, StreamPackage。
StreamLink:Streamlink is a command-line utility which pipes video streams from various services into a video player.
StreamLive:StreamLive 依托腾讯云全球部署的众多可用区的计算资源,结合腾讯自研应用深耕多年的音视频技术平台以及全球领先的音视频 AI 技术,将腾讯云视频直播的核心底层能力开放给用户,不仅为全球开发者提供专业、稳定、高效的直播流转码、转封装、传输等基础服务,同时,提供数字版权保护以及SCTE35广告解决方案等增值等服务能力。
StreamPackage:StreamPackage 依托腾讯云全球部署的众多可用区的计算资源,增加源弹性,允许视频供应商能够大规模安全稳定地分配视频流媒体。
09 Intel 芯片产品
Intel 架构师 张宇明作分享。
这里先介绍了芯片产品,高矩阵 Intel 5th Xeon,单核,低延时,多稳态。
助力 Valorant,也是腾讯投资公司。他们用编译优化提升引擎(硬件)性能,(提升性能)无需修改一行代码。
我们所熟知的《开心消消乐》,由于 AI 助力提升了 3 倍性能。该游戏是 CPU + GPU 组合。但是 GPU 又贵又难买,但是扩展性好,也受到欢迎。
关于 Valorant
无畏契约,一个游戏公司。点击进入
官网。
10 拥抱,AI 产品助力人工审核
腾讯云智慧传媒解决方案专家 张宇明 作分享。
首个 AI 应用案例,审核。
先让 AI 筛选一波,再推送审核人员。针对终端用户而言,沟通效率提升,通过智能体的方式,提升效率,其实团队宗旨,是让每一位一线员工,包括记者,都能用上这些功能。而非像传统软件产品,工具性很强,操作纷繁复杂。现在都是一键部署,无需学习说明书。
分享者认为,适当孵化 AI 智能体公司(或者模块),进行团队整体能力提升,才是提升效率良策。
1.举个例子,MediaLink,据说,可以提升每天动作效率,使得每天的工作方式都有所改变。
采取方式,预设模式,以及人工加工。解决外链接,以及工作效率的问题。
这些工作,可以由腾讯会议,以及腾讯文档共同完成。
评注:腾讯文档可能部分承担传文本信息的作用。
2.AI 应用解决了媒体人生产以及沟通问题遇到的问题,使用 AI 套件。
如果用户需要与各行各业打交道,可用到的工具包括但不限于 腾讯会议、AI 助手。这些组建可以以下工作:
第一,明确任务是什么;
第二,明确要怎么完成任务;
第三,会议纪要。
3.其他应用场景包括,内部私有化+混合云模式。这些工具使用在 内网专网,助力于内容留存。
然而针对媒体人与生态圈,对应地使用公网。
不仅仅是自己单位,可能连上下游企业,也未必开发了 API,这时候要通过统一的门户(例如,企业微信),让用户拥有最简便、最快速入口进入会议。
关于 MediaLink
羚邦集团有限公司(香港股份:2230.HK)是一间领先的知识产权(Intellectual Property,IP)管理公司,总部设在香港,业务遍及中国、日本和东南亚,积极透过旗下IP推动文化交流,把高质素娱乐带到全亚洲。
这类业务模式,和学姐目前在做的公司很像。
MUSINESS商用版权音乐平台,专注商用版权音乐的授权与交易,营造中国良好的商用音乐版权意识及交易环境。聚合了约300000首大牌音乐、配乐、音效曲库。
主要获取授权使用的费用。
11 大模型应用
智谱企业商业技术中心,柴思远分享。
1.GLM-4V-Plus 首个通用视频 API。视频总结 - 推理能力 - 多轮对话 - 问答 - 修改。
2.生成图 CogView。
3.生成视频模型,CogVideoX。通过文字生成图片,运镜效果 。
4.新一代 MaaS。
过程:训练 - 微任务 - 微模型。
私有专区部署,也是个方向。
5.自己开发的【星脉网络】。
6.LLMs 如何落地?
第一,基座模型。这里分享者定义为,把原来的事情做得更好。
第二,组织。这里 LLMs 需要满足要求:耐心自持、承担业务 BP 角色、发动全员使用。
第三,数据资产。发挥业务数据的价值。
第四,业务场景。
12 传统行业的应用
猎聘技术总监莫瑜作分享。
猎聘将求职者划分为:金领、白领、灰领、蓝领。
(1)求职招聘系统
痛点,门槛高,逻辑表达能力有限。
其中,针对逻辑表达,可采用 NLP 表达招聘诉求,这是针对招聘方的。对话方面,帮助阅读,例如,求职者意向沟通。
(2)智能面试官系统 Doris
Doris 容纳的是 Know-how 技能,包括理论、实战经验。
技术:混元大模型(底层) - 腾讯 ASR (中间) - 腾讯 TRTC (应用层,例如,视频输入、输出)
智能测评
智能防作弊
写在最后
作为技术分享,很多信息碎片化,而且加上基础知识不够,怎么使用这些资讯呢?
笔者给出建议:
第一,看这些团队使用哪些工具;
第二,看他们如何进行工程。如何确定工期,如何纠错,如何压力测试;
第三,看他们的应用场景;
第四,看他们设计的沟通指标,这是创业公司,和行业沟通的最简单直接的【共同语言】。
参考文献
[1] 用户10071055(2023),向量数据库|一文全面了解向量数据库的基本概念、原理、算法、选型,2023
[2] 腾讯云(2024),分布式数据库 TDSQL,腾讯云,2024
[3] 环球科技网(2024),腾讯全球数字生态大会召开:全面升级智能化、国际化、融合创新三大产品体系 ,搜狐网,2024
[4] 飞象网(2024),MAXHUB亮相2024腾讯全球数字生态大会,为企业提效注入“数智”能量,新浪网,2024