0%;font-family: -apple-system, BlinkMacSystemFont, "Helvetica Neue", "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);line-height: 1.5em;box-sizing: border-box !important;overflow-wrap: break-word !important;">TikTok零播放、被限流了?做好这些方法,破百万太简单!!!
要解决去重的问题,我们先来理解,TikTok到底怎么查重?
TikTok查重的技术原理
注意:TikTok未对外公布过算法,以及判定行为的逻辑。
这些是我查证查重技术论文后的个人的理解。我且一说,你且一听,不对莫喷,友好交流。
人工智能视频检测系统,工作过程。
最简单,最古老的方法,自然是视频的MD5编码,这个只要我们不用软件去修改。下载保存多少次都不会变。
但是!!!在我们掐头去尾时,md5就变了。
我们知道在很多年前,图片相似度对比技术就已经很成熟了,
视频就是连续流动播放的一张一张图片组成的,我们现在的视频参数:每秒30帧。就是每秒播放由30张图片组成。这个你在剪映里放到大就能看清楚。
但是每秒就有30张图片,系统肯定不能完全判断,因为数据太大,服务器负载不了,而且,条件也不允许,所以,一定要人工配合才可以,这就是为什么我们上传视频的时候,系统还给推荐,但是有些视频一段时间后,被判定违规的原因。
接下来我们分析TikTok判定标准。
把视频拆分成为图片,每一帧就是一张图片,我们上传作品的时候,TikTok会对视频进行合成,这个前台有提示的,其实这个合成并不是上传,而是在中转服务器进行质量压缩,在这个过程中,系统已经把视频拆分或者未拆分,截取样张保持起来,可能每个视频抽样截图10-30张,开始和结束画面,都会至少截图一张图片,其他图片不详。
当我们点击发布视频时,系统至少会做四个动作:
压缩视频减小体积
音乐单独剥离
截取样张
样张对比
其中样张对比,不仅是对服务器里面的视频是否重复进行判断,还会对视频样张中的图片是否包含广告,以及敏感内容进行判断,系统不是人眼,他无法知道什么是违规,什么是广告,什么是重复的内容,只是在对数据图片进行对比,和服务器图片像素度高的保留记录。作品播放量几万的时候,就会推荐给人工复核。
人工怎么会知道这个作品是搬运还是原创的呢?
其实,她也不知道,光只看一个视频的话。
但是!!!
这个时候系统会把作品池里相似度高的视频,排序列出来。
比如,相似度90~99%,相似度80~90%,相似度70~80%,这些作品列出来,前五个或者前十个,审核人员只要在符合作品的时候,点击相似度查看,就能轻而易举的识别,这个作品是原创还是搬运的了。
真实的逻辑和维度,肯定比上面阐述的复杂得多,这里面包含的技术有:
图像识别,模式识别,计算机视觉,图像理解,大数据建模、人工给样本打标识等等。
我个人理解,像80%以上相似度,应该是机器直接给判定重复,给0播放。
下面再看看,怎么应对去重,先说做法,然后再给大家举几个例子。
在这里多说一句:所有的攻防对抗,都是需要耗费成本的。
如果所有你做的防查重工作,成本已经超过你做原创,那就直接原创了,大趋势也是这样。
1、视频的外在的信息属性:【描述】、【标签】、【封面】基础的信息需要修改好
2、视频自身的信息,通过水印、加上片头片尾,剪接长度,调整分别率,添加文字logo,帧数,改变画面(比如镜像、滑动,加工样式、画中画,滤镜,等等)、改变关键帧、修改bgm等,这个维度上的修改基本保证视频可以过关了。
3、挑选视频的时候注意,尽量不要找当下已经非常爆的素材,已经非常热的视频,素材一定要符合视频规范,避开血腥暴力,比如在展示伤口这种,还有提起来宠物逗玩,视频都符合外国文化习俗,避开敏感类话题,可以选一些小众冷门有趣的类目
在学习了基本的by视频后,熟悉了tiktok的基本玩法后,我个人还是建议,小伙们要打造有生命力的IP,内容为王才能长远的发展,这样才能接广告赚取创业者基金实现变现,才是发展之道!!
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/165859.html