基于TensorFlow.js和COCO-SsD模型的实时目标检测网络应用程序


基于TensorFlow.js和COCO-SsD模型的实时目标检测网络应用程序

实现流程
  • 访问用户的桌面录屏并且显示视频源(位置居中)。
  • 对视频源进行实时目标检测。
  • 在检测到的目标周围绘制边界框,并用它们的类别和检测置信度进行标记。
  • 在视频源下方显示一个唯一检测到的目标列表,显示目标类别和首次检测到的时间。
  • 确保每个目标类别只列出一次,不管它被检测到多少次。
  • 使用2帧每秒的检测频率来平衡性能和响应性。
  • 包括屏幕录制访问和模型加载的错误处理。
  • 为应用程序设计一个干净、现代的外观,并具有响应式设计。
  • 将所有必要的HTML、CSS和JavaScriptt包含在一个单一的自包含文件中。
  • 为TensorFlow.js和COCO-SSD模型库使用CDN链接。 请提供完整可运行的HTML文件,其中包含内联CSS和JavaScript。
效果图
代码
html 复制代码
<!DOCTYPE html>
<html lang="zh-CN">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>实时目标检测</title>
    <script src="https://cdn.jsdelivr.net/npm/@tensorflow/tfjs"></script>
    <script src="https://cdn.jsdelivr.net/npm/@tensorflow-models/coco-ssd"></script>
    <style>
        body {
            font-family: Arial, sans-serif;
            display: flex;
            flex-direction: column;
            align-items: center;
            background-color: #f0f0f0;
            margin: 0;
            padding: 20px;
        }
        h1 {
            color: #333;
        }
        #videoContainer {
            position: relative;
            margin-bottom: 20px;
        }
        #output {
            position: absolute;
            top: 0;
            left: 0;
        }
        #detectionsList {
            background-color: white;
            border-radius: 8px;
            padding: 20px;
            box-shadow: 0 4px 6px rgba(0, 0, 0, 0.1);
            max-width: 600px;
            width: 100%;
        }
        #detectionsList h2 {
            margin-top: 0;
        }
        #detectionsList ul {
            list-style-type: none;
            padding: 0;
        }
        #detectionsList li {
            margin-bottom: 10px;
            padding: 10px;
            background-color: #f9f9f9;
            border-radius: 4px;
        }
        #error {
            color: red;
            margin-top: 20px;
        }
    </style>
</head>
<body>
    <h1>实时目标检测</h1>
    <div id="videoContainer">
        <video id="video" width="640" height="480" autoplay muted></video>
        <canvas id="output" width="640" height="480"></canvas>
    </div>
    <div id="detectionsList">
        <h2>检测到的目标</h2>
        <ul id="detectedObjects"></ul>
    </div>
    <div id="error"></div>

    <script>
        const video = document.getElementById('video');
        const output = document.getElementById('output');
        const ctx = output.getContext('2d');
        const detectedObjects = document.getElementById('detectedObjects');
        const errorDiv = document.getElementById('error');

        let model;
        let detections = new Map();

        async function setupCamera() {
            try {
                const stream = await navigator.mediaDevices.getDisplayMedia({ video: true });
                video.srcObject = stream;
                return new Promise((resolve) => {
                    video.onloadedmetadata = () => {
                        resolve(video);
                    };
                });
            } catch (error) {
                errorDiv.textContent = '无法访问屏幕录制:' + error.message;
                throw error;
            }
        }

        async function loadModel() {
            try {
                model = await cocoSsd.load();
            } catch (error) {
                errorDiv.textContent = '无法加载模型:' + error.message;
                throw error;
            }
        }

        async function detectObjects() {
            try {
                const predictions = await model.detect(video);
                ctx.clearRect(0, 0, ctx.canvas.width, ctx.canvas.height);
                ctx.drawImage(video, 0, 0, ctx.canvas.width, ctx.canvas.height);

                predictions.forEach(prediction => {
                    const [x, y, width, height] = prediction.bbox;
                    ctx.strokeStyle = '#00FFFF';
                    ctx.lineWidth = 2;
                    ctx.strokeRect(x, y, width, height);
                    
                    ctx.fillStyle = '#00FFFF';
                    ctx.font = '16px Arial';
                    ctx.fillText(`${prediction.class} (${Math.round(prediction.score * 100)}%)`, x, y > 10 ? y - 5 : 10);

                    if (!detections.has(prediction.class)) {
                        const timestamp = new Date().toLocaleTimeString();
                        detections.set(prediction.class, timestamp);
                        updateDetectionsList();
                    }
                });
            } catch (error) {
                console.error('检测对象时出错:', error);
            }

            setTimeout(detectObjects, 500); // 每2秒检测一次 (2 FPS)
        }

        function updateDetectionsList() {
            detectedObjects.innerHTML = '';
            detections.forEach((timestamp, objectClass) => {
                const li = document.createElement('li');
                li.textContent = `${objectClass} - 首次检测时间: ${timestamp}`;
                detectedObjects.appendChild(li);
            });
        }

        async function run() {
            try {
                await setupCamera();
                await loadModel();
                detectObjects();
            } catch (error) {
                console.error('应用程序初始化失败:', error);
            }
        }

        run();
    </script>
</body>
</html>
相关推荐
dsyyyyy110133 分钟前
JavaScript变量
开发语言·javascript·ecmascript
kyriewen1 小时前
手写 Promise.all、race、any:不到 30 行代码,解决并发异步的所有姿势
前端·javascript·面试
胡志辉的博客2 小时前
深入浅出理解浏览器事件循环:从一道输出题讲到 Chrome 源码
前端·javascript·chrome·chromium·event loop
代码不加糖3 小时前
js中不会冒泡的事件有哪些?
前端·javascript·vue.js
懂懂tty3 小时前
Vue2与Vue3之间API差异
前端·javascript·vue.js
小二·4 小时前
Next.js 15 全栈开发实战
开发语言·javascript·ecmascript
Rain5095 小时前
2.1 Nest.js 项目初始化与模块化架构
开发语言·前端·javascript·后端·架构·数据分析·node.js
拾年2756 小时前
从零手写 Ajax:用原生 XHR 搭建前后端交互全流程
前端·javascript·ajax
拉勾科研工作室6 小时前
区块链工程毕业论文题目【249个】
开发语言·javascript
小林ixn6 小时前
你以为你懂 + 号?看完这篇 Bun + TS 实战,才发现以前全写错了
前端·javascript·typescript