IntraScribe

Web 应用语音视频
立即访问
应用介绍

IntraScribe 是面向企业、学校与机关等内网环境的本地优先语音转写与协作平台:支持实时转写、说话人分离、高质量批处理、AI 总结与标题生成。默认提供浏览器 WebRTC 接入与 SSE 实时返回,也支持边缘设备/硬件作为前端,架构解耦、可替换任意采集与传输方案;数据全程留在本地,重视隐私与合规。


🔍 功能特性

  • 本地优先与隐私保护:可在内网/离线环境独立部署,数据不外发,满足隐私与合规要求。

  • 团队与组织协作:账号体系、模板共享与编辑流程,适配企业/学校多用户协作。

  • 硬件友好与可插拔前端:支持浏览器或边缘设备/硬件作为采集端,传输方案可替换。

  • 实时转写(本地 ASR):浏览器或硬件端录音,低延迟推流到后端,SSE 实时返回转写片段;支持断字清理与时间戳格式化。

  • 批处理高质量转写:会话结束后整合缓存音频,自动上传至 Supabase Storage,调用通用音频处理服务进行说话人分离与重转写,提升质量与结构化程度。

  • 说话人分离与重命名:基于 pyannote.audio 的说话人分离,完成后在前端可双击标签重命名,并同步更新数据库中的转写 segments。

  • AI 总结与标题生成:集成 LiteLLM,支持按模板生成结构化 Markdown 总结,并自动生成简洁标题;支持回退策略。

  • 模板管理:支持用户模板与系统模板,设为默认、复制系统模板到用户侧、统计使用次数等。

  • 录音会话管理:创建、完成、删除、重新转写、查看音频文件/转写/总结等;提供当前活跃会话状态与内存缓存状态查询。

  • 数据存储与实时订阅:基于 Supabase(Postgres + Auth + Storage + Realtime);前端通过频道订阅感知会话/转写的变化并刷新界面。

  • 可编辑的转写:在前端对转写进行局部编辑并保存回后端,保留/合成时间戳与说话人信息。

  • 注册登录等的管理界面。


🎯 适用场景

  • 企业/事业单位内网部署的会议记录与知识沉淀

  • 学校/研究机构的课堂与研讨记录(支持多人与说话人标注)

  • 会议室/指挥中心/生产现场等对隐私与延迟敏感的场景

  • 涉及敏感数据的法务、医疗、研发等不允许数据外发的团队