文本工具
文本工具
文本工具Paperless-ngx文档管理工具 paperless-gpt 安装和使用指南
Paperless GPT 是与 paperless - ngx 搭配使用的文档工具,借助AI生成文档标题和标签,减少手动分类的时间成本,将OCR技术与大语言模型(LLM)结合,在扫描复杂的文档文件时,能提取出高精度文本。 Paperless GPT支持OpenAI、Ollama等大语言模型,可处理低质量或复杂布局的扫描件,相比传统OCR,能结合上下文纠正识别错误,输出更精准的文本内容。 Paperless GPT提供多种OCR服务: LLM OCR:利用OpenAI或Ollama从图像中提取文本。 G
数据库工具
数据库工具无代码数据库 Teable
Teable 是 Airtable 的替代方案,用于构建无代码 PostgreSQL 数据库应用。Teable 能处理数百万行的大量数据,提供自托管的部署能力,数据可以存储在云端、本地或私有服务器上。 前后端分离:前端基于 Next.js 构建,支持国际化配置和实时数据同步,后端使用 Nest.js 框架,实现业务逻辑和数据接口的分离,集成了 Prisma 作为 ORM 工具,用于管理数据库迁移和查询。 模块化设计: • apps 目录包含前端应用与 Nest.js 后端服务(AGPL 3.0 协议)
博客系统
博客系统Bolo 菠萝博客(Java博客系统)
Bolo菠萝博客,部署简单,自带精致主题、数据统计表、邮件提醒、自定义图床、功能丰富的 Markdown 编辑器等。 技术架构:基于Solo深度定制开发,采用Java技术栈。支持多种部署方式,包括Tomcat、Docker、宝塔面板,适配Windows、Linux、MacOS系统和Web容器,兼容ARM和X86/64处理器架构,安装流程简单,提供完善文档指导。 数据管理:具备一键备份功能,保障数据安全,内置轻型防火墙,能有效阻止恶意访问,支持评论过滤机制。 内容创作:集成强大的Vditor编辑器,支持所
大型语言模型工具
大型语言模型工具GraphGen 基于知识图谱的合成数据生成框架,用于增强大型语言模型(LLMs)的监督微调效果
GraphGen是一个由知识图谱引导的合成数据生成框架,从源文本构建一个细粒度的知识图谱,使用预期校准误差指标识别大语言模型中的知识差距,优先生成针对高价值长尾知识的问答对。 GraphGen通过多跳邻域采样来捕捉复杂的关系信息,采用风格控制生成,让最终的问答数据更多样化。 可以通过网页入口体验GraphGen。 运行python webui/app.py命令,上传文本块(比如农业、医疗保健或海洋科学方面的知识),填入大语言模型的API密钥,就能在线生成Llama Factor和tuner所需的训练数据
AI工具
AI工具ACI.dev 开源基础设施,支持MCP服务器为AI智能体提供600+工具
ACI 开源基础设施为AI智能体提供600+工具,支持MCP服务器。 ACI.dev 能让AI代理通过多租户身份验证、精细权限控制和动态工具发现,访问600多个工具,这些工具可以通过直接函数调用,能借助统一模型上下文协议(MCP)服务器来实现。 以前要是想让AI代理使用Google Calendar、Slack这些服务,得分别写OAuth流程和API客户端,麻烦得很,但有了ACI.dev,只需要用它来管理身份验证,就能为AI代理提供统一、安全的函数调用,还能通过统一MCP服务器,或者轻量级Python
视频工具
视频工具PyVideoTrans 视频翻译配音工具
PyVideoTrans 是一个强大的视频翻译配音工具,能将一种语言的视频转换为指定语言的视频,自动生成和添加相应语言的字幕与配音。 语音识别 PyVideoTrans 支持多种语音识别模型,包括 faster-whisper、openai-whisper、Google Speech 和阿里中文语音识别模型(zh_recogn)。 文字翻译 PyVideoTrans 支持微软翻译、Google 翻译、百度翻译、腾讯翻译、ChatGPT、Azure AI、Gemini、DeepL、DeepLX 和离线翻译
1