Skip to content

kevinluosl/any-action-vl

Repository files navigation

AnyActionVL / 智能动作识别

将闲置设备变身智能监控,用 AI 守护你关心的人

⚠️ 说明:该项目所有代码由 AI 生成

GitHub License

AnyActionVL Demo

📖 项目简介

AnyActionVL 是一个基于 AI 视觉识别的智能动作监控系统,可以轻松将你的电脑或手机摄像头转变为实时事件预警设备。通过先进的视觉语言模型(VL Model),系统能够实时分析画面并识别特定动作,及时发出告警通知。

🎯 核心特性

  • 🎥 实时视频分析 - 基于摄像头实时画面进行 AI 分析
  • 🔔 智能动作识别 - 可自定义监测目标动作(如打哈欠、闭眼等)
  • 📱 多设备支持 - 支持电脑和手机摄像头,让闲置设备发挥价值
  • 💾 本地数据存储 - 使用 IndexedDB 本地存储,保护隐私
  • 🎨 现代化 UI - 精美的实时监控界面,支持全屏查看
  • 📊 历史统计 - 告警记录统计与分析功能
  • 🔧 多 AI 服务商 - 支持 Gemini、百度千帆、阿里通义千问

🚀 应用场景

👴 家庭安全监控

  • 老人安全看护 - 监测老人是否跌倒、长时间静止等异常情况
  • 夜间监护 - 监控老人夜间活动状态,及时发现异常

👶 儿童监护

  • 作业状态监测 - 观察孩子做作业时的专注度和状态
  • 婴儿夜间监控 - 监测婴儿夜间睡眠状态,及时发现异常

💼 工作场景

  • 工作状态观察 - 监控人员工作状态,提高工作效率
  • 疲劳检测 - 识别打哈欠、闭眼等疲劳信号

💡 更多可能

  • 宠物行为监控
  • 仓库安全监控
  • 任何需要通过摄像头进行事件预警的场景

🛠️ 技术栈

  • 前端框架: React 19 + TypeScript
  • 构建工具: Vite
  • AI 服务:
    • Google Gemini 2.5 Flash
    • 百度千帆 Qwen2.5-VL
    • 阿里通义千问 Qwen3-VL-Flash
  • 数据存储: IndexedDB
  • 样式: Tailwind CSS

📦 快速开始

环境要求

  • Node.js 18+
  • 现代浏览器(支持摄像头 API)

安装步骤

  1. 克隆项目

    git clone https://github.com/kevinluosl/any-action-vl.git
    cd any-action-vl
  2. 安装依赖

    npm install
  3. 运行项目

    npm run dev
  4. 访问应用

    • 打开浏览器访问 https://localhost:3000(Vite 会自动配置 HTTPS)
    • 允许摄像头权限
    • 在设置中配置 AI 服务商的 API Key
    • 开始使用!

配置 AI 服务

在设置页面中,你可以选择并配置以下 AI 服务商之一:

  • Google Gemini: 需要 Gemini API Key
  • 百度千帆: 需要 Qianfan API Key/Token
  • 阿里通义千问: 需要 DashScope API Key

📊 代码统计

主要代码文件(排除 import 语句)

文件 总行数 import行数 实际代码行数
App.tsx 440 12 428
index.tsx 24 3 21
services/db.ts 205 0 205
services/geminiService.ts 313 0 313
components/CameraFeed.tsx 112 1 111
components/ControlPanel.tsx 61 2 59
components/DescriptionOverlay.tsx 36 2 34
components/Header.tsx 64 2 62
components/HistoryModal.tsx 314 3 311
components/Icons.tsx 125 1 124
components/LiveAlertList.tsx 62 2 60
components/LivePreview.tsx 32 1 31
components/SettingsModal.tsx 288 3 285
components/ZoomOverlay.tsx 37 2 35
总计 2,113 34 2,079

最终统计

  • 实际代码行数(排除 import):2,079 行
  • 包含配置文件:2,107 行

🎨 功能演示

  • 实时监控 - 摄像头画面实时显示,AI 持续分析
  • 动作识别 - 自定义监测目标,系统自动识别并告警
  • 告警通知 - 声音提示 + 语音播报,确保及时响应
  • 历史记录 - 查看所有告警记录,支持搜索和筛选
  • 统计分析 - 告警频率、时段分布、趋势分析
  • 高清抓拍 - 自动保存告警时刻的高清截图

🤝 贡献

欢迎提交 Issue 和 Pull Request!

📄 许可证

本项目采用 MIT 许可证 - 查看 LICENSE 文件了解详情

🔗 相关链接

⭐ 如果这个项目对你有帮助,请给个 Star!


让 AI 守护你关心的人 ❤️

Made with ❤️ by AI

About

AnyActionVL 是一个基于 AI 视觉识别的智能动作监控系统,可以轻松将你的电脑或手机摄像头转变为实时事件预警设备。通过先进的视觉语言模型(VL Model),系统能够实时分析画面并识别特定动作,及时发出告警通知。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors