[5机器学习]python计算机视觉应用-图片内容识别

上一期中,ofter介绍了计算机视觉的常用神经网络模型,以及如何选择模型,今天我们就趁热打铁拿个实际的模型跑跑,欢迎大家跨入数据科学家们的世界。

Table of Contents

一、机器学习的目标

作为数据科学家,我们必须明白投入大量时间精力进行机器学习、深度学习的目的是什么?将非结构化、低密度、低价值的大数据转换为高密度和高价值数据。当我们对张三发布的某张照片进行内容识别的时候,这张照片就是非结构化、低密度、低价值的数据;但是当我们对他多年发布的N张照片进行内容识别后,我们大概率可以分析得出张三的生活习惯、爱好、朋友圈等等。

二、机器学习的步骤

  1. 确定需要使用的框架、预训练模型、编程语言;
  2. 准备需要训练的数据集;
  3. 预处理数据;
  4. 构建模型;
  5. 训练模型;
  6. 使用训练好的模型。

三、图像检测实战应用

数据科学家的主要任务是使用正确或表现良好的模型进行数据分析的实际应用。因此,今天ofter以图像检测为例,使用训练好的模型测试下检测效率和效果。本案例使用的框架Tensorflow+Keras,训练好的模型RetinaNet,编程语言python。其中,训练好的模型,大家可以从modelzoo中或其他途径搜索https://modelzoo.co/

3.1 引用所需模块

看上图,我们可以知道需要对识别的图片绘制边框和打印识别标签,因此,除了引用keras_retinanet模型模块以外,我们还需要引用可视化绘制图表、绘制边框、打标签、设置标签颜色的模块。

from keras_retinanet import models
from keras_retinanet.utils.image import read_image_bgr, preprocess_image, resize_image
from keras_retinanet.utils.visualization import draw_box, draw_caption
from keras_retinanet.utils.colors import label_color
import matplotlib.pyplot as plt
import cv2
import os
import numpy as np
import time
import sys
sys.path.insert(0, '../')

3.2 加载RetinaNet模型

# 加载已经训练好的retinanet模型
model_path = os.path.join('..', 'snapshots', 'resnet50_coco_best_v2.1.0.h5')
model = models.load_model(model_path, backbone_name='resnet50')
print(model.summary())
# 标签名称映射
labels_to_names = {0: 'person', 1: 'bicycle', 2: 'car', 3: 'motorcycle', 4: 'airplane', 5: 'bus', 6: 'train', 7: 'truck', 8: 'boat', 9: 'traffic light', 10: 'fire hydrant', 11: 'stop sign', 12: 'parking meter', 13: 'bench', 14: 'bird', 15: 'cat', 16: 'dog', 17: 'horse', 18: 'sheep', 19: 'cow', 20: 'elephant', 21: 'bear', 22: 'zebra', 23: 'giraffe', 24: 'backpack', 25: 'umbrella', 26: 'handbag', 27: 'tie', 28: 'suitcase', 29: 'frisbee', 30: 'skis', 31: 'snowboard', 32: 'sports ball', 33: 'kite', 34: 'baseball bat', 35: 'baseball glove', 36: 'skateboard', 37: 'surfboard', 38: 'tennis racket', 39: 'bottle', 40: 'wine glass', 41: 'cup', 42: 'fork', 43: 'knife', 44: 'spoon', 45: 'bowl', 46: 'banana', 47: 'apple', 48: 'sandwich', 49: 'orange', 50: 'broccoli', 51: 'carrot', 52: 'hot dog', 53: 'pizza', 54: 'donut', 55: 'cake', 56: 'chair', 57: 'couch', 58: 'potted plant', 59: 'bed', 60: 'dining table', 61: 'toilet', 62: 'tv', 63: 'laptop', 64: 'mouse', 65: 'remote', 66: 'keyboard', 67: 'cell phone', 68: 'microwave', 69: 'oven', 70: 'toaster', 71: 'sink', 72: 'refrigerator', 73: 'book', 74: 'clock', 75: 'vase', 76: 'scissors', 77: 'teddy bear', 78: 'hair drier', 79: 'toothbrush'}

其中
resnet50_coco_best_v2.1.0.h5是已经训练过数据集的文件。当我们加载模型时,可以看下该模型的网络结构。

3.3 图像识别代码

# 测试图片
image = read_image_bgr('house.png')
# 图片转换为RGB格式
draw = image.copy()
draw = cv2.cvtColor(draw, cv2.COLOR_BGR2RGB)
# 预处理图片
image = preprocess_image(image)
image, scale = resize_image(image)
# 处理图片
start = time.time()
boxes, scores, labels = model.predict_on_batch(np.expand_dims(image, axis=0))
# 输出图片处理时间
print("processing time: ", time.time() - start)
# 纠正图片比例
boxes /= scale
# 实例检测
for box, score, label in zip(boxes[0], scores[0], labels[0]):
    if score < 0.5:
        break
    color = label_color(label)
    b = box.astype(int)
    draw_box(draw, b, color=color)
    caption = "{} {:.3f}".format(labels_to_names[label], score)
    draw_caption(draw, b, caption)
# 输出图片识别结果
plt.figure(figsize=(15, 15))
plt.axis('off')
plt.imshow(draw)
plt.show()

原图:

检测后:

一般,我们会对识别分score<0.5的进行剔除,当然,我们也可以提高识别分,或者降低识别分,比如降低到score<0.1的剔除,那么识别的内容会有更多的可能性。

四、完整的机器学习

当然,如果你想要学习完整的机器学习步骤,ofter推荐一个网址:

https://tensorflow.google.cn/tutorials/keras/classification?hl=zh-cn

本案例的代码下载地址:

https://github.com/fizyr/keras-retinanet

文章出处登录后可见!

立即登录
已经登录? 立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
青葱年少的头像青葱年少普通用户
0
【聚类算法】DBSCAN算法及其Python实现
上一篇 2022年5月21日
BOF算法 基于SIFT+KMeans
下一篇 2022年5月21日

相关推荐

  • 相机标定-张正友棋盘格标定法 2022年5月22日
  • torchvision.transforms 数据预处理:ToTensor() 2023年8月8日
  • 在 Linux 环境下安装 Pycharm 2023年3月5日
  • 【机器学习】Meta-Learning(元学习) 2023年2月26日
  • Adam与AdamW 2023年7月6日
  • 让我们在 Python 中使用 ChatGPT,这是目前的热门话题! 2023年3月12日
  • pandas删除重复数据 2023年8月8日
  • 【Python • 图片识别】pytesseract快速识别提取图片中的文字 2023年3月6日
  • 第十五篇【传奇开心果系列】Python的OpenCV库技术点案例示例:图像配准 2024年2月19日
  • Diffusion Models扩散模型简单讲解与简单实现 2023年2月26日
  • 分割结果可视化:怎么把标签mask轮廓显示在原图上 2023年7月13日
  • 基于VGG19的图片分割网络 2022年3月28日
  • 到底什么是上采样、下采样 2023年5月31日
  • 异常检测:Towards Total Recall in Industrial Anomaly Detection 2023年2月25日
  • 使用Python快速进行Excel合并 2023年11月9日
  • 原力计划 2023年4月5日

赞助商

此站出售,如需请站内私信或者邮箱!

天下网标王网站优化的特点有哪些物流运输网站优化服务肇庆首页网站关键词优化方法重庆网站排名优化哪家便宜辽宁餐饮行业网站优化要多少钱省心的传统行业网站优化政务网站的优化方案什么是网站地图优化铁岭网站长尾关键词优化模版网站有利于优化优化网站设计优选金手指20无锡网站优化咨询融海科技网站优化主要内容包括哪些茂名优化网站最优企业网站优化平台广饶英文网站优化定制密云网站推广网站优化关于优化网站网站优化难广州市靠谱的网站优化网站优化排名皆选兴田德润杭州网站优化 鹊起科技河南家装行业网站优化推广技巧武汉孟孟网站优化绍兴网站快照优化网站优化友情链接怎么换如何分析一个网站优化深圳网站优化seo新浦网站优化推广平顶山网站推广优化怎么选香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

天下网标王 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化