首页
学习
活动
专区
工具
TVP
发布
首页标签内容理解

#内容理解

文本、视觉场景的 AI 解决方案

扩散模型图像理解力刷新SOTA!字节复旦团队提出全新「元提示」策略

新智元

Text-to-image(T2I)扩散模型在生成高清晰度图像方面显示出了卓越的能力,这一成就得益于其在大规模图像-文本对上的预训练。

17110

DALL·E 3瞬间生成素材,零成本制作数千万流水游戏!OpenAI总裁转赞

新智元

说明至少DALL·E 3对于中文背景的内容理解还是到位的,但是确实对于中文prompt的支持就比较一般了。

22830

OpenAI,面试总结,挂了...

对白

梦中情司,自己海投了N多次,写了N多次小作文都没回复,最后靠大佬朋友内推才有了面试机会。先手动感谢下大佬。是onsite挂掉的,记得当时等HR回复那几天很煎熬(...

55320

Video-LLaMa:利用多模态增强对视频内容理解

deephub

在数字时代,视频已经成为一种主要的内容形式。但是理解和解释视频内容是一项复杂的任务,不仅需要视觉和听觉信号的整合,还需要处理上下文的时间序列的能力。本文将重点介...

46020

科技传承 智启未来|2023腾讯犀牛鸟前沿技术论坛

腾讯高校合作

在多模态视觉内容理解与生成、智能语音语义、大规模推荐和AI+基础平台四大平行技术论坛上,2023犀牛鸟专项研究计划的学者与腾讯技术专家带来了三十多场学术报告并进...

28120

每日学术速递7.6

AiCharm

1.JourneyDB: A Benchmark for Generative Image Understanding

18530

音频品鉴与歌唱评价——音频内容理解实践

LiveVideoStack

各位同行朋友们,大家好,很高兴和大家一起分享交流,本次分享的主题是音频品鉴与歌唱评价——音频内容理解的一些技术实践。我是来自天琴实验室的益靓。

83510

他们拿走腾讯广告百万奖金,我算是知道票圈广告为啥那么多赞了

量子位

就有不少选手表示,此番有关视频广告内容理解的赛题“够难,够有挑战性”。还真别小看它们,其中,“视频广告秒级语义解析”作为最早被提出的赛题,最初还曾因难度太大差点...

37010

下一代听歌识曲技术探索;银河音效技术实践;歌唱评价与内容理解实践;音乐驱动虚拟人

LiveVideoStack

下一代听歌识曲技术探索 Topic 《QQ音乐下一代听歌识曲技术》 孔令城? 腾讯音乐天琴实验室 音频识别组组长 传统的听歌识曲技术是一种严格的基于音频内容的匹...

88230

DNSPod十问孙子荀:电竞大神+AI专家,鹅厂程序员的双面人生

便宜云主机DNSPod团队

总而言之,游戏生态内容、买量内容、营销内容是从创作出发点来说的,落脚点看这些内容到底起到了什么样的价值就需要数据多维度来看了。我们团队的「游量科学」产品会通过人...

82010

QQ音乐内容理解与精细化运营

腾讯大讲堂

腾讯 · 产品经理 (已认证)

以上就是我们整理内容理解的主要解决方案了。接下来介绍一下我们是如何应用这些内容理解的结果的,分为两个大章节来介绍,首先是内容运营中台。

1.3K20

ACM MM & ECCV 2022 | 美团视觉8篇论文揭秘内容领域的智能科技

美团技术团队

人工智能技术正在成为内容产业的中台力量,其中视觉AI已经渗透到内容生产、内容审核、内容分发、用户互动、商业化变现等各个环节。美团视觉智能部以场景化的内容产品、智...

79930

业界首个!快手提出亿级别多模态短视频百科体系快知

机器之心

当前,越来越多的短视频用户不仅希望利用碎片化的时间来休闲娱乐,也开始希望能够在短视频平台中获取更多知识。2021 年,快手泛知识内容播放量同比增长 58.11%...

48120

到小红书去,AI技术青年大有可为

机器之心

作为近年来国内发展最迅速的移动互联网平台之一,小红书平台吸引了无数用户在这里交换生活经验、分享生活态度。基于独特的社区生态和丰富的落地场景,这个超大型 UGC ...

51920

腾讯杰出科学家刘威:多媒体AI技术如何让广告系统更“智能”?

便宜云主机开发者

计算广告的本质在于以合理的价格,将合适的广告推给适合的人,因此广告理解、用户理解是整个广告推荐链路的基础依赖。随着下一代广告系统的到来,对广告内容理解也提出了更...

2.3K20

微博为何让人上瘾?幕后推荐算法解密

新智元

王巍向我们介绍说,微博推荐系统整体由三部分构成:内容理解、用户理解,以及推荐系统。

29020

CVPR 2022:字节跳动多项竞赛夺冠,发力无障碍技术创新

新智元

字节跳动旗下的极光-多模态技术团队、智能创作团队、火山引擎多媒体实验室团队斩获了多项竞赛冠军,覆盖「视觉问答」、「图像实例分割」、「长视频内容理解」、「图片恢复...

1.5K50

大厂的广告系统升级,怎能少了大模型的身影

机器之心

为此,针对内容理解,混元AI大模型使用大量无监督广告内容,构建一个通用的多模态内容理解预训练模型,并预期它能为各种下游理解任务提供更强的基础能力。

1.3K20

5G时代消息的推送方式

产品言语

导读:信息应用是作为手机终端出厂必备的应用,目前用户量最大的应用之一,由于OTT(Over The Top)聊天应用如微信、QQ等快速崛起,个人使用信息应用的频...

46450

广告行业中那些趣事系列36:腾讯2021广告大赛多模态视频广告标签baseline介绍和优化思路

数据拾光者

摘要:本篇主要介绍下腾讯2021广告大赛多模态视频广告标签baseline以及优化思路。首先介绍参加比赛的背景,相比于单模态文本理解,多模态视频内容的理解更具挑...

44610
领券
http://www.vxiaotou.com