2026年5月12日 1 分钟阅读

BiliNote:开箱即用的 AI 视频笔记工具,支持多平台、多模型、本地部署

tinyash 0 条评论

一句话介绍

BiliNote 是一个开源的 AI 视频笔记助手。你给它一个视频链接(B 站、YouTube、抖音、快手,或者本地视频文件),它自动完成音频转写、内容总结和结构化笔记生成,输出一份带截图和时间戳跳转的 Markdown 笔记。

GitHub 地址:https://github.com/JefferyHcool/BiliNote | License: MIT ⭐ 2.5k+

在线体验:https://www.bilinote.app | 文档:https://docs.bilinote.app


核心功能

1. 多平台视频输入

支持五大来源:

平台支持方式
Bilibili链接 / 浏览器插件(优先利用本地登录态抓字幕)
YouTube链接 / 优先获取原生字幕,跳过音频下载
抖音链接(基于 Douyin_TikTok_Download_API)
快手链接
本地视频文件直传

2. AI 驱动的笔记生成

整个流水线分为三步:

  1. 音频提取与转写 — 支持 Fast-Whisper(本地 GPU/CUDA)、MLX-Whisper(Apple Silicon)、Groq API、BCut 等多种转写引擎
  2. 大模型总结 — 将转写文本提交给 GPT 大模型,生成结构化笔记
  3. Markdown 输出 — 包含目录、分节内容、时间戳跳转链接、自动截图插入、视频封面 Banner

笔记风格可自定义:学术风、口语风、重点提取等 9 种预设,格式(标题层级、代码块、引用等)也可自由配置。

3. 灵活的模型配置

不绑定任何特定服务商,用户可以自行配置:

  • 大模型供应商:OpenAI、DeepSeek、Qwen 等任意兼容 API 的模型
  • 音频转写引擎:Fast-Whisper / MLX-Whisper(本地)、Groq / BCut(API),可自由切换
  • 多模态视频理解:支持带画面分析的综合总结(需模型支持多模态)

4. RAG 问答

在已生成的笔记基础上,支持基于 RAG(检索增强生成)的 AI 问答:

  • 索引范围包括笔记正文、视频元信息(标题、作者、简介、标签等)
  • 支持 Function Calling,模型可主动检索原文数据
  • AI 回复支持 Markdown 渲染,提供半屏/全屏两种模式
  • 笔记历史版本保留,可随时回溯

5. 浏览器插件

提供 Chrome / Edge / Firefox 三个版本的浏览器插件(MV3),包含:

  • 工具栏 Popup 快速提交链接
  • 视频页面悬浮按钮一键生成
  • 右键菜单
  • 侧边栏(Markdown 预览 / 思维导图 / AI 问答)
  • 插件设置页:模型供应商管理、转写配置、下载配置、浏览器 Cookie 一键同步、部署状态监控

部署方式

方式一:Docker(推荐)

# 标准部署
docker pull ghcr.io/jefferyhcool/bilinote:latest
docker run -d -p 80:80 \
  -v bilinote-data:/app/backend/data \
  --name bilinote \
  ghcr.io/jefferyhcool/bilinote:latest

# GPU 加速部署(需要 NVIDIA GPU + nvidia-docker)
docker-compose -f docker-compose.gpu.yml up -d

Docker 镜像已内置 FFmpeg,无需额外安装。

方式二:桌面客户端

Releases 页面下载 Windows / macOS 客户端。

桌面客户端特性:

  • 首次启动四步引导(连通自检 → 供应商/模型配置 → 转写引擎选择 → Cookie 提示)
  • 右下角后端运行状态指示,支持查看日志和一键重启
  • 启动时自动检测中文/空格路径并弹窗告警(Windows)

注意:Windows 用户必须在非中文路径下运行。

方式三:源码部署

git clone https://github.com/JefferyHcool/BiliNote.git
cd BiliNote

# 配置环境变量
mv .env.example .env

# 启动后端 (FastAPI)
cd backend
pip install -r requirements.txt
python main.py

# 启动前端 (React + Tauri)
cd ../BillNote_frontend
pnpm install
pnpm dev

前置依赖:系统需安装 ffmpeg


技术栈

层级技术选型
后端Python / FastAPI
前端React 19 + Tauri(桌面客户端)
AI 模型接入通用 GPT 适配层(UniversalGPT),兼容多供应商多模态格式
语音转写Fast-Whisper、MLX-Whisper、Groq、BCut
容器化Docker + Docker Compose(含 GPU 版本)
CI/CDGitHub Actions(含 commitlint、release 自动化)
浏览器插件Chrome Manifest V3(含 popup、悬浮按钮、侧边栏、右键菜单)

工程化亮点

除了功能本身,这个项目在工程规范上也做得相当到位:

  • 完善的 CONTRIBUTING.md / RELEASING.md / CHANGELOG.md
  • Issue 和 PR 模板
  • commitlint CI 确保提交信息规范
  • Docker 镜像自动构建并推送至 ghcr.io
  • 桌面客户端 CI 构建(Windows x64 + macOS ARM64)
  • 中文路径检测、模型切换确认等细节打磨

看得出来作者是以长期维护的开源项目标准在做,不是随手写的 demo。


适用场景

  • 学习笔记:技术教程、公开课、学术讲座等长视频的知识点提取和归档
  • 会议记录:内部技术分享、线上会议的视频/录音转文字加总结
  • 内容再创作:视频创作者快速获取视频文案结构,方便二次编辑
  • 知识管理:生成的 Markdown 笔记可导出 PDF/Word/Notion,融入个人知识库

总结

BiliNote 解决了一个很实际的需求:把视频内容高效转化为可检索、可回顾的文本笔记。它的优势在于:

  1. 平台覆盖广,国内主流的 B 站、抖音、快手都支持
  2. 模型不锁定,可以接自己的 API Key,数据不出自己控制的范围
  3. 部署灵活,普通用户用网页版,进阶用户可以 Docker 自部署,开发者可以源码跑
  4. 开源 MIT 协议,自由使用、修改、二次开发
  5. 持续迭代,issue 响应及时,版本更新频率高

如果你经常看知识类长视频,或者有视频笔记批量化处理的需求,这个项目值得一试。

发表评论

你的邮箱地址不会被公开,带 * 的为必填项。