搜文章
推荐 原创 视频 Java开发 iOS开发 前端开发 JavaScript开发 Android开发 PHP开发 数据库 开发工具 Python开发 Kotlin开发 Ruby开发 .NET开发 服务器运维 开放平台 架构师 大数据 云计算 人工智能 开发语言 其它开发
Lambda在线 > 飞桨PaddlePaddle > AI时代咱用脸玩“飞机大战”,PaddleHub让你秒变“脸控”游戏达人

AI时代咱用脸玩“飞机大战”,PaddleHub让你秒变“脸控”游戏达人

飞桨PaddlePaddle 2020-06-18

AI时代咱用脸玩“飞机大战”,PaddleHub让你秒变“脸控”游戏达人


AI时代还拿着手机打飞机游戏是不是out了?飞桨PaddleHub带你体验不一样的游戏玩法。


从世界上第一款游戏诞生开始,电玩都需要依赖手柄和按键进行,无论是PC游戏,还是 XBOX 、PS 这类主机游戏,控制器和手柄都是不可缺少的。


直到2009年微软发布了第一代 Kinect,将人体检测作为游戏控制,彻底颠覆了游戏的单一操作,开创了解放双手的先河,使人机互动的理念更加彻底地展现出来。但是之后,2018 年微软彻底弃用了 Kinect 实在让人惋惜!


大众流行的游戏文化中,人机互动的主流方式还是离不开手柄,即使到了手机和Pad 横行的移动时代,大多数的主流游戏依然利用的是虚拟键盘和虚拟手柄的交互方式。


人类发展的动力其实很大一部分来自于人类“懒惰”的天性,所以对我而言,如果能通过更简单、自由的交互方式玩游戏,将是非常有意思的事情。虽然我们离脑机接口和思维控制还有很长的路要走,但是随着深度学习的发展,相信不久的将来,交互方式也会产生天翻地覆的变化。


基于此,我尝试做了人脸打飞机的游戏项目!



效果展示




使用普通电脑自带的摄像头捕捉人体动作(这里主要是头部),进而转化为对于游戏的控制。


左转头部:飞机往左飞
右转头部:飞机往右飞
抬头:飞机向上
低头:飞机向下
张嘴:丢炸弹!

操作简单欢乐,据说还能治好程序猿们的颈椎病~~

而这一切的实现非常简单,只要使用 飞桨PaddleHub 封装好的深度学习模型即可,由此获得头部的角度检测,然后链接到游戏控制即可!

无需人工智能的高深技术理念,绝对小白同学也可以轻松搞定!!!


实现方法




打飞机游戏的实现需要完成分如下三个步骤:


  • 使用PaddleHub中的 facelandmarklocalization 模型实现头部运动监测。
  • 使用Pygame实现打飞机游戏主体程序。(这里用了最简单易上手,通常用来做 Python 入门初体验的 Pygame)
  • 将头部运动监测模块加入游戏中。

AI时代咱用脸玩“飞机大战”,PaddleHub让你秒变“脸控”游戏达人
下面我给大家详细介绍一下具体的代码实现。

01
安装 PaddleHub

  1. 安装飞桨。
  2. 安装Paddlehub。

  
    
    
  
pip install paddlehub

在这个游戏中使用的是 PaddleHub 中的 facelandmarklocalization 模型,安装好 PaddleHub 以后就可以直接调用了!

模型的详细介绍参考:
https://www.paddlepaddle.org.cn/hubdetail?name=face_landmark_localization&en_category=KeyPointDetection


02
实现游戏主体程序

这里我使用的是自己初学 Python 时,用 Pygame 制作的打飞机游戏。素材上,无论图片、飞机模型还是背景音乐网上非常多,非常容易获取(因为是入门款嘛~)


  
    
    
  
pip install pygame

具体的文件和素材请参考AI Studio:
https://aistudio.baidu.com/aistudio/projectdetail/405645

文件夹中分别存放了图片,音乐和字体素材。通过pygame的各种模块和函数来定义各项游戏内容的参数,比如敌机出现的时间、运动的方向、运动速度、碰撞等事件监测等,这里就不一一赘述了。

然后开始实现最重要的游戏主体文件,定义整个游戏如何开始,如何循环,如何操作,如何结束。

原程序中,我是用 空格键、上下左右键来控制飞机,对应的程序片段如下:

  
    
    
  
if bomb_num  and event.key == K_SPACE:
    bomb_sound_use.play()
    bomb_num -=  1
key_pressed = pygame.key.get_pressed()
if key_pressed[K_w]  or key_pressed[K_UP]:
    myplane.move_up()  # 飞机向上飞
elif key_pressed[K_s]  or key_pressed[K_DOWN]:
    myplane.move_down()  # 飞机向下飞
elif key_pressed[K_a]  or key_pressed[K_LEFT]:
    myplane.move_left()  # 飞机向左飞
elif key_pressed[K_d]  or key_pressed[K_RIGHT]:
    myplane.move_right()  # 飞机向右飞

03
将 PaddleHub 的头部运动监测模块加入游戏中

1. 加入人脸识别和头部姿态识别的类,先通过人脸检测找到视频画面中人脸的位置。

在第一版程序中,使用了ultralightfastgenericfacedetector1mb_640,虽然精度更高,但是和游戏程序结合起来后资源消耗太大,影响了速度。第二版听取专家的建议,降低为ultralightfastgenericfacedetector1mb_320,精度其实足够用了,同时大幅提升了游戏的流畅度!

  
    
    
  
class MyFaceDetector(object):
    """
    自定义人脸检测器
    """

    def  __init__(self):
        self.module = hub.Module(name="ultra _light_fast _generic_face _detector_1mb_320")
        self.alpha = 0.75
        self.start_flag = 1

    def face _detection(self, images, use_gpu=False, visualization=False):
        # 使用GPU运行,use _gpu=True,并且在运行整个教程代码之前设置CUDA_VISIBLE_DEVICES环境变量
        result = self.module.face _detection(images=images, use_gpu=use_gpu, visualization=visualization)
        if not result[ 0][ 'data']:
            return result

        face = result[ 0][ 'data'][ 0]
        if self.start_flag == 1:

            self.left_s = result[ 0][ 'data'][ 0][ 'left']
            self.right_s = result[ 0][ 'data'][ 0][ 'right']
            self.top_s = result[ 0][ 'data'][ 0][ 'top']
            self.bottom_s = result[ 0][ 'data'][ 0][ 'bottom']

            self.start_flag = 0
        else:
            # 加权平均上一帧和当前帧人脸检测框位置,以稳定人脸检测框
            self.left _s = self.alpha * self.left_s + (1 - self.alpha) * face['left']
            self.right _s = self.alpha * self.right_s + (1 - self.alpha) * face['right']
            self.top _s = self.alpha * self.top_s + (1 - self.alpha) * face['top']
            self.bottom _s = self.alpha * self.bottom_s + (1 - self.alpha) * face['bottom']

        result[ 0][ 'data'][ 0][ 'left'] = self.left_s
        result[ 0][ 'data'][ 0][ 'right'] = self.right_s
        result[ 0][ 'data'][ 0][ 'top'] = self.top_s
        result[ 0][ 'data'][ 0][ 'bottom'] = self.bottom_s

        return result

然后通过头部姿态识别,来判定头部的动作状态。

在第一版程序中,使用了欧拉角的计算来获得人头部的运动状态,但是计算很复杂,对于数学基础不是很好的人非常难理解。第二版中,把头部运动状态的计算方式大幅简化,只采用了facelandmarklocalization识别出的68个人脸关键点中的7个就达到了很好的预期效果,而且算法更简洁明了,实际效果也非常流畅!

  
    
    
  
class HeadPostEstimation():
     """
    头部姿态识别
    """


     def __init__(self, face_detector=None):
        self.module = hub.Module(name= "face_landmark_localization", face_detector_module=face_detector)


     def get_face_landmark(self, image):
         """
        预测人脸的68个关键点坐标
        images(ndarray): 单张图片的像素数据
        """

         try:
             # 选择GPU运行,use_gpu=True,并且在运行整个教程代码之前设置CUDA_VISIBLE_DEVICES环境变量
            res = self.module.keypoint_detection(images=[image], use_gpu= True)
             return  True, res[ 0][ 'data'][ 0]
         except Exception  as e:
            logger.error( "Get face landmark localization failed! Exception: %s " % e)
             return  FalseNone

     def get_lips_distance(self, face_landmark):
         """
        从face_landmark_localization的检测结果中查看上下嘴唇的距离
        """


        lips_points = np.array([
            face_landmark[ 52], face_landmark[ 58]
        ], dtype= 'float')

        head_points = np.array([
            face_landmark[ 25], face_landmark[ 8]
        ], dtype= 'float')

        lips_distance = np.sum(np.square(lips_points[ 0] - lips_points[ 1]))
        head_distance = np.sum(np.square(head_points[ 0] - head_points[ 1]))
        relative_distance = lips_distance / head_distance
         return relative_distance

     def get_nose_distance(self,face_landmark):
         """
        从face_landmark_localization的检测结果中获得鼻子的位置,以此判断头部运动
        """


        nose_point = np.array([
            face_landmark[ 31]
        ], dtype= 'float')

        cheek_points = np.array([
            face_landmark[ 3], face_landmark[ 15]
        ], dtype= 'float')

        left_distance = np.sum(np.square(nose_point[ 0] - cheek_points[ 0]))
        right_distance = np.sum(np.square(nose_point[ 0] - cheek_points[ 1]))
        nose_position_h = left_distance/(left_distance+right_distance)

        nose_position_v = nose_point[ 0][ 1]-cheek_points[ 0][ 1# 获得鼻子和脸颊定位点的高度相对值,以此作为抬头/低头的判断

         return nose_position_h, nose_position_v


     def classify_pose(self, video):
         """
        video 表示不断产生图片的生成器
        """


         for index, img  in enumerate(video(), start= 1):
            self.img_size = img.shape

            success, face_landmark = self.get_face_landmark(img)

             if  not success:
                logger.info( "Get face landmark localization failed! Please check your image!")
                 continue

             if  not success:
                logger.info( "Get rotation and translation vectors failed!")
                 continue

             # 计算嘴唇距离
            lips_distance = self.get_lips_distance(face_landmark)

             # 计算鼻子左右位置
            nose_position_h, nose_position_v = self.get_nose_distance(face_landmark)

             # 转换成摄像头可显示的格式
            img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

             # 本地显示预测视频框,AIStudio项目不支持显示视频框
             #cv2.imshow('Pose Estimation', img_rgb)

             return nose_position_h, nose_position_v, lips_distance

在游戏程序初始化时启动摄像头进行头部监测。

  
    
    
  
# 使用头部控制飞机
    face_detector = MyFaceDetector()
     # 打开摄像头
    capture = cv2.VideoCapture( 0)

     def generate_image():
         while  True:
             # frame_rgb即视频的一帧数据
            ret, frame_rgb = capture.read()
             # 按q键即可退出
             if cv2.waitKey( 1) &  0xFF == ord( 'q'):
                 break
             if frame_rgb  is  None:
                 break
            frame_bgr = cv2.cvtColor(frame_rgb, cv2.COLOR_RGB2BGR)
             yield frame_bgr
        capture.release()
        cv2.destroyAllWindows()

    head_post = HeadPostEstimation(face_detector)

在原来游戏程序主循环中,把控制算法都替换为头部监测后的输出。
  
    
    
  
# 获取头部运动数据,并控制飞机
nose_position_h, nose_position_v, lips_distance = head_post.classify_pose(video=generate_image)
#print(nose_position_h, nose_position_v, lips_distance) # 该语句用来查看评估参数如何设计
if nose_position_h <  0.22:
    myplane.move_left()  # 由于摄像头演示中镜面关系,实际使用中请设置为myplane.move_right()
elif nose_position_h >  0.48:
    myplane.move_right()  # 由于摄像头演示中镜面关系,实际使用中请设置为myplane.move_left()
elif nose_position_v <  -40:
    myplane.move_up()
elif nose_position_v >  -25:
    myplane.move_down()

# 张嘴就是炸弹,dis_control<0.045 为闭嘴
if lips_distance <  0.045:
    flag =  1
if bomb_num  and lips_distance >  0.055  and flag ==  1:
    flag =  0
    bomb_sound_use.play()
    bomb_num -=  1

万事俱备,一键运行,见证奇迹的时刻到了


将所有的代码和素材下载到本地后,就可以启动 mani.py 一键运行啦!(电脑要有摄像头哦!)

大家也可以把其中的代码片段加入到自己的游戏程序里,相信你们的创意可以带来更多不同凡响的呈现效果!

在尝试的过程中,第一版和第二版的差距还是非常明显的,大家可以看看效果呈现对比:
https://www.bilibili.com/video/BV1uZ4y147ur



共同探讨




在实现过程中有几个下问题,还需要进一步研究和探讨:


  • 由于调整参数的时候,是基于我自己的脸进行的,所以不知道别人的脸控制游戏时精度会不会有影响。

  • 原来想再做一版人脸和飞机重叠的效果呈现,但是在 pygame 的框架下还没折腾出来怎么实现。

  • 摄像头视角和人类视角是镜面关系,所以为了拍摄视频我调整成为了左右相反,实际中需要对调过来。



未来可期




第二版完成后,本来想做个第三版,利用 PaddleHub 的人体骨骼监测模块,实现通过人体运动来控制飞机,但是这个模块目前还没有办法直接接入实时的视频画面,所以作罢了。


不过好消息是,听说不久的将来 PaddleHub 会对各个模块的接口进行进一步的丰富,到时候应该可以实现了,有没有小伙伴愿意一起一试呢?

PaddleHub项目地址:
GitHub: https://github.com/PaddlePaddle/PaddleHub
Gitee: https://github.com/PaddlePaddle/PaddleHub

PaddleHub教程合集:
https://aistudio.baidu.com/aistudio/course/introduce/1070

PaddleHub实践分享:
https://aistudio.baidu.com/aistudio/personalcenter/thirdview/79927

如在使用过程中有问题,可加入飞桨官方QQ群进行交流: 703252161

如果您想详细了解更多飞桨的相关内容,请参阅以下文档。

官网地址:
https://www.paddlepaddle.org.cn

飞桨开源框架项目地址:
GitHub:
https://github.com/PaddlePaddle/Paddle
Gitee: 
https://gitee.com/paddlepaddle/Paddle

END


版权声明:本站内容全部来自于腾讯微信公众号,属第三方自助推荐收录。《AI时代咱用脸玩“飞机大战”,PaddleHub让你秒变“脸控”游戏达人》的版权归原作者「飞桨PaddlePaddle」所有,文章言论观点不代表Lambda在线的观点, Lambda在线不承担任何法律责任。如需删除可联系QQ:516101458

文章来源: 阅读原文

相关阅读

关注飞桨PaddlePaddle微信公众号

飞桨PaddlePaddle微信公众号:PaddleOpenSource

飞桨PaddlePaddle

手机扫描上方二维码即可关注飞桨PaddlePaddle微信公众号

飞桨PaddlePaddle最新文章

精品公众号随机推荐