网站收录不增加,wordpress博客点赞,视频网站怎样做,如何做二级域名子目录网站文章目录0 简介1 课题背景2 技术原理和方法2.1基本原理2.2 技术选型和方法3 实例分割4 实现效果最后0 简介
今天学长向大家分享一个毕业设计项目
毕业设计 深度学习语义分割实现弹幕防遮(源码分享)
#x1f9ff; 项目分享:见文末!
1 课题背景
弹幕是显示在视频上的评论 项目分享:见文末!1 课题背景弹幕是显示在视频上的评论可以以滚动、停留甚至更多动作特效方式出现在视频上是观看视频的人发送的简短评论。各大视频网站目前都有弹幕功能之家也于2020年5月正式上线视频弹幕功能受到了广大网友的喜爱大家在观看视频的同时也能通过弹幕进行互动。但密集的弹幕遮挡视频画面严重影响用户观看体验如何解决查阅了相关视频网站发现B站推出了一种蒙版弹幕技术可以让弹幕自动躲避人形区域达到弹幕不挡人的效果。B站视频弹幕不挡人的效果2 技术原理和方法2.1基本原理通过AI计算机视觉的技术对视频内容进行分析并将之前已经定义好的“视频主体内容”进行识别生成蒙版并分发给客户端后让客户端利用 CSS3 的特性进行渲染从而达成最终的效果。这样就形成了我们最终看到的“不挡脸”弹幕效果。实现方法就正如 PS 中的“蒙版“一样实心区域允许空白区域拒绝从而达到弹幕不挡人的效果。而技术的核心就在蒙版的生成上所以将这个功能称之为“蒙版弹幕”。2.2 技术选型和方法1、提取视频帧画面。对音视频的处理大家一般都会想到FFmpeg组件我们也是使用FFmpeg组件提取每帧的视频画面使用的是PyAV组件PyAV是FFmpeg封装能够灵活的编解码视频和音频并且支持Python常用的数据格式如numpy。2、识别视频帧画面人像区域。解决方案使用AI计算机视觉的实例分割技术可以识别视频帧画面的人像区域。3、AI框架目前市面上的AI框架主要以TensorFlowPyTorch最流行。TensorFlow出身豪门的工业界霸主由Google Brain团队研发。具有如下优点支持多种编程语言灵活的架构支持多GPU、分布式训练跨平台运行能力强自带TensorBoard组件能可视化计算图便于让用户实时监控观察训练过程官方文档非常详尽可查询资料众多社区庞大大量开发者活跃于此。PyTorch以动态图崛起的学术界宠儿是基于Torch并由Facebook强力支持的python端的开源深度学习库。具有如下优点简洁PyTorch在设计上更直观追求尽量少的封装建模过程透明代码易于理解易用应用十分灵活接口沿用Torch契合用户思维尽可能地让用户实现“所思即所得”不过多顾虑框架本身的束缚社区提供完整的文档和指南用户可以通过全面的教程完成从入门到进阶有疑问也可以在社区中获得各种及时交流的机会。我们的选择PyTorch。原因TensorFlow入门难度较大学习门槛高系统设计过于复杂而PyTorch入门难度低上手快而且提供的功能也非常易用预训练模型也非常多。4、实例分割技术实例分割Instance Segmentation是视觉经典四个任务中相对最难的一个它既具备语义分割Semantic Segmentation的特点需要做到像素层面上的分类也具备目标检测Object Detection的一部分特点即需要定位出不同实例即使它们是同一种类。3 实例分割简介实例分割已成为机器视觉研究中比较重要、复杂和具有挑战性的领域之一。为了预测对象类标签和特定于像素的对象实例掩码它对各种图像中出现的对象实例的不同类进行本地化。实例分割的目的主要是帮助机器人自动驾驶监视等。实例分割同时利用目标检测和语义分割的结果通过目标检测提供的目标最高置信度类别的索引将语义分割中目标对应的Mask抽取出来。实例分割顾名思义就是把一个类别里具体的一个个对象具体的一个个例子分割出来。Mask R-CNN算法本项目使用Mask R-CNN算法来进行图像实例分割。网络结构图Mask R-CNN一个相对简单和灵活的实例分割模型。该模型通过目标检测进行了实例分割同时生成了高质量的掩模。通常Faster R-CNN有一个用于识别物体边界框的分支。Mask R-CNN并行添加了一个对象蒙版预测分支作为改进。使用FPN主干的head架构如图所示。关键代码##利用不同的颜色为每个instance标注出mask根据box的坐标在instance的周围画上矩形 ##根据class_ids来寻找到对于的class_names。三个步骤中的任何一个都可以去掉比如把mask部分 ##去掉那就只剩下box和label。同时可以筛选出class_ids从而显示制定类别的instance显示,下面 ##这段就是用来显示人的其实也就把人的id选出来然后记录它们在输入ids中的相对位置从而得到 ##相对应的box与mask的准确顺序 def display_instances_person(image, boxes, masks, class_ids, class_names, scoresNone, title, figsize(16, 16), axNone): the funtion perform a role for displaying the persons who locate in the image boxes: [num_instance, (y1, x1, y2, x2, class_id)] in image coordinates. masks: [height, width, num_instances] class_ids: [num_instances] class_names: list of class names of the dataset scores: (optional) confidence scores for each box figsize: (optional) the size of the image. #compute the number of person temp [] for i, person in enumerate(class_ids): if person 1: temp.append(i) else: pass person_number len(temp) person_site {} for i in range(person_number): person_site[i] temp[i] NN boxes.shape[0] # Number of personinstances #N boxes.shape[0] N person_number if not N: print(\n*** No person to display *** \n) else: # assert boxes.shape[0] masks.shape[-1] class_ids.shape[0] pass if not ax: _, ax plt.subplots(1, figsizefigsize) # Generate random colors colors random_colors(NN) # Show area outside image boundaries. height, width image.shape[:2] ax.set_ylim(height 10, -10) ax.set_xlim(-10, width 10) ax.axis(off) ax.set_title(title) masked_image image.astype(np.uint32).copy() for a in range(N): color colors[a] i person_site[a] # Bounding box if not np.any(boxes[i]): # Skip this instance. Has no bbox. Likely lost in image cropping. continue y1, x1, y2, x2 boxes[i] p patches.Rectangle((x1, y1), x2 - x1, y2 - y1, linewidth2, alpha0.7, linestyledashed, edgecolorcolor, facecolornone) ax.add_patch(p) # Label class_id class_ids[i] score scores[i] if scores is not None else None label class_names[class_id] x random.randint(x1, (x1 x2) // 2) caption {} {:.3f}.format(label, score) if score else label ax.text(x1, y1 8, caption, colorw, size11, backgroundcolornone) # Mask mask masks[:, :, i] masked_image apply_mask(masked_image, mask, color) # Mask Polygon # Pad to ensure proper polygons for masks that touch image edges. padded_mask np.zeros( (mask.shape[0] 2, mask.shape[1] 2), dtypenp.uint8) padded_mask[1:-1, 1:-1] mask contours find_contours(padded_mask, 0.5) for verts in contours: # Subtract the padding and flip (y, x) to (x, y) verts np.fliplr(verts) - 1 p Polygon(verts, facecolornone, edgecolorcolor) ax.add_patch(p) ax.imshow(masked_image.astype(np.uint8)) plt.show()4 实现效果原视频生成帧蒙板最终效果最后 项目分享:见文末!