BiliNote:开箱即用的 AI 视频笔记工具,支持多平台、多模型、本地部署
一句话介绍
BiliNote 是一个开源的 AI 视频笔记助手。你给它一个视频链接(B 站、YouTube、抖音、快手,或者本地视频文件),它自动完成音频转写、内容总结和结构化笔记生成,输出一份带截图和时间戳跳转的 Markdown 笔记。
GitHub 地址:https://github.com/JefferyHcool/BiliNote | License: MIT ⭐ 2.5k+
在线体验:https://www.bilinote.app | 文档:https://docs.bilinote.app
核心功能
1. 多平台视频输入
支持五大来源:
| 平台 | 支持方式 |
|---|---|
| Bilibili | 链接 / 浏览器插件(优先利用本地登录态抓字幕) |
| YouTube | 链接 / 优先获取原生字幕,跳过音频下载 |
| 抖音 | 链接(基于 Douyin_TikTok_Download_API) |
| 快手 | 链接 |
| 本地视频 | 文件直传 |
2. AI 驱动的笔记生成
整个流水线分为三步:
- 音频提取与转写 — 支持 Fast-Whisper(本地 GPU/CUDA)、MLX-Whisper(Apple Silicon)、Groq API、BCut 等多种转写引擎
- 大模型总结 — 将转写文本提交给 GPT 大模型,生成结构化笔记
- Markdown 输出 — 包含目录、分节内容、时间戳跳转链接、自动截图插入、视频封面 Banner
笔记风格可自定义:学术风、口语风、重点提取等 9 种预设,格式(标题层级、代码块、引用等)也可自由配置。
3. 灵活的模型配置
不绑定任何特定服务商,用户可以自行配置:
- 大模型供应商:OpenAI、DeepSeek、Qwen 等任意兼容 API 的模型
- 音频转写引擎:Fast-Whisper / MLX-Whisper(本地)、Groq / BCut(API),可自由切换
- 多模态视频理解:支持带画面分析的综合总结(需模型支持多模态)
4. RAG 问答
在已生成的笔记基础上,支持基于 RAG(检索增强生成)的 AI 问答:
- 索引范围包括笔记正文、视频元信息(标题、作者、简介、标签等)
- 支持 Function Calling,模型可主动检索原文数据
- AI 回复支持 Markdown 渲染,提供半屏/全屏两种模式
- 笔记历史版本保留,可随时回溯
5. 浏览器插件
提供 Chrome / Edge / Firefox 三个版本的浏览器插件(MV3),包含:
- 工具栏 Popup 快速提交链接
- 视频页面悬浮按钮一键生成
- 右键菜单
- 侧边栏(Markdown 预览 / 思维导图 / AI 问答)
- 插件设置页:模型供应商管理、转写配置、下载配置、浏览器 Cookie 一键同步、部署状态监控
部署方式
方式一:Docker(推荐)
# 标准部署 docker pull ghcr.io/jefferyhcool/bilinote:latest docker run -d -p 80:80 \ -v bilinote-data:/app/backend/data \ --name bilinote \ ghcr.io/jefferyhcool/bilinote:latest # GPU 加速部署(需要 NVIDIA GPU + nvidia-docker) docker-compose -f docker-compose.gpu.yml up -d
Docker 镜像已内置 FFmpeg,无需额外安装。
方式二:桌面客户端
在 Releases 页面下载 Windows / macOS 客户端。
桌面客户端特性:
- 首次启动四步引导(连通自检 → 供应商/模型配置 → 转写引擎选择 → Cookie 提示)
- 右下角后端运行状态指示,支持查看日志和一键重启
- 启动时自动检测中文/空格路径并弹窗告警(Windows)
注意:Windows 用户必须在非中文路径下运行。
方式三:源码部署
git clone https://github.com/JefferyHcool/BiliNote.git cd BiliNote # 配置环境变量 mv .env.example .env # 启动后端 (FastAPI) cd backend pip install -r requirements.txt python main.py # 启动前端 (React + Tauri) cd ../BillNote_frontend pnpm install pnpm dev
前置依赖:系统需安装 ffmpeg。
技术栈
| 层级 | 技术选型 |
|---|---|
| 后端 | Python / FastAPI |
| 前端 | React 19 + Tauri(桌面客户端) |
| AI 模型接入 | 通用 GPT 适配层(UniversalGPT),兼容多供应商多模态格式 |
| 语音转写 | Fast-Whisper、MLX-Whisper、Groq、BCut |
| 容器化 | Docker + Docker Compose(含 GPU 版本) |
| CI/CD | GitHub Actions(含 commitlint、release 自动化) |
| 浏览器插件 | Chrome Manifest V3(含 popup、悬浮按钮、侧边栏、右键菜单) |
工程化亮点
除了功能本身,这个项目在工程规范上也做得相当到位:
- 完善的 CONTRIBUTING.md / RELEASING.md / CHANGELOG.md
- Issue 和 PR 模板
- commitlint CI 确保提交信息规范
- Docker 镜像自动构建并推送至 ghcr.io
- 桌面客户端 CI 构建(Windows x64 + macOS ARM64)
- 中文路径检测、模型切换确认等细节打磨
看得出来作者是以长期维护的开源项目标准在做,不是随手写的 demo。
适用场景
- 学习笔记:技术教程、公开课、学术讲座等长视频的知识点提取和归档
- 会议记录:内部技术分享、线上会议的视频/录音转文字加总结
- 内容再创作:视频创作者快速获取视频文案结构,方便二次编辑
- 知识管理:生成的 Markdown 笔记可导出 PDF/Word/Notion,融入个人知识库
总结
BiliNote 解决了一个很实际的需求:把视频内容高效转化为可检索、可回顾的文本笔记。它的优势在于:
- 平台覆盖广,国内主流的 B 站、抖音、快手都支持
- 模型不锁定,可以接自己的 API Key,数据不出自己控制的范围
- 部署灵活,普通用户用网页版,进阶用户可以 Docker 自部署,开发者可以源码跑
- 开源 MIT 协议,自由使用、修改、二次开发
- 持续迭代,issue 响应及时,版本更新频率高
如果你经常看知识类长视频,或者有视频笔记批量化处理的需求,这个项目值得一试。