document-illustrator
🎯Skillfrom op7418/document-illustrator-skill
Intelligently analyzes document content and automatically generates professional, stylized illustrations that visually summarize key themes across different document formats using AI-powered image ...
Installation
npx skills add https://github.com/op7418/document-illustrator-skill --skill document-illustratorSkill Details
Overview
# Document Illustrator

> 基于 AI 智能分析的文档配图生成工具
[](https://opensource.org/licenses/MIT)
[](https://www.python.org/downloads/)
Document Illustrator 是一个 Claude Code Skill,它能智能理解文档内容,自动归纳核心要点,并为每个主题生成专业配图。无需依赖特定文档格式,AI 会理解内容并生成符合你选择风格的高质量图片。
✨ 核心特性
- 🤖 AI 智能归纳:自动理解文档内容,智能提取核心主题,无需依赖标题格式
- 📝 格式无关:支持任何格式的文档(Markdown、纯文本、PDF 等)
- 🎨 三种风格:渐变玻璃卡片、票据风格、矢量插画,满足不同场景需求
- 📐 灵活比例:支持 16:9(横屏)和 3:4(竖屏)两种图片比例
- 🖼️ 封面图可选:可生成概括全文的封面图作为系列配图的引导
- ✅ 内容完整:展示归纳结果供你确认,确保所有重要信息都被包含
🚀 快速开始
使用 npx 安装(推荐)
```bash
npx skills add https://github.com/op7418/Document-illustrator-skill
```
手动安装
- 克隆或下载本仓库到 Claude Skills 目录:
```bash
cd ~/.claude/skills/
git clone https://github.com/op7418/Document-illustrator-skill.git
```
- 配置 API 密钥(见下方"配置说明"部分)
- 安装 Python 依赖(见下方"环境要求"部分)
基本使用
在 Claude Code 中直接告诉 Claude:
```
帮我为这个文档生成配图:/path/to/document.md
```
或者:
```
我想为这篇文章生成一些配图
```
Claude 会引导你完成整个配图生成流程。
🎨 三种风格说明
1. 渐变玻璃卡片风格 (gradient-glass)
视觉特点:
- Apple Keynote 风格的极简主义设计
- 玻璃拟态(Glassmorphism)效果
- 深邃虚空黑或纯净陶瓷白基底
- 流动的极光渐变色
- 3D 玻璃物体和发光效果
适用场景:
- 科技产品介绍
- 数据分析报告
- 未来趋势展望
- 产品功能演示
2. 票据风格 (ticket)
视觉特点:
- 数字极简票券设计
- 高度对比的黑白配色
- 类似登机牌、门票的结构化布局
- 精确的几何分区
- 中英混排,多向文字布局
适用场景:
- 信息图表
- 统计数据展示
- 时间线和流程图
- 要点总结
3. 矢量插画风格 (vector-illustration)
视觉特点:
- 扁平化矢量插画
- 统一粗细的黑色轮廓线
- 复古柔和的配色方案
- 几何化处理
- 横向全景式构图
适用场景:
- 故事叙述
- 概念解释
- 教育内容
- 品牌宣传
📦 安装和配置
步骤 1: 安装 Skill
使用 npx(推荐):
```bash
npx skills add https://github.com/op7418/Document-illustrator-skill
```
手动安装:
```bash
cd ~/.claude/skills/
git clone https://github.com/op7418/Document-illustrator-skill.git
cd document-illustrator
```
步骤 2: 配置 API 密钥
- 获取 Gemini API 密钥:[Google AI Studio](https://makersuite.google.com/app/apikey)
- 在 Skill 根目录创建
.env文件:
```bash
cd ~/.claude/skills/document-illustrator
echo "GEMINI_API_KEY=your-api-key-here" > .env
```
或直接编辑 .env 文件:
```env
GEMINI_API_KEY=your-api-key-here
```
> 安全提示:.env 文件包含敏感信息,请勿提交到版本控制系统
步骤 3: 安装 Python 依赖
```bash
cd ~/.claude/skills/document-illustrator
pip install google-genai pillow python-dotenv
```
或使用 pip3:
```bash
pip3 install google-genai pillow python-dotenv
```
步骤 4: 验证安装
运行测试命令:
```bash
python3 scripts/generate_single_image.py --help
```
预期输出应显示脚本的帮助信息,表示安装成功。
📖 使用方法
方式 1: 通过 Claude Code 使用(推荐)
这是主要的使用方式,让 Claude 智能处理整个流程。
基本命令:
```
帮我为这个文档生成配图:~/blog/my-article.md
```
交互式流程:
- 选择图片比例
- 16:9(横屏)- 适合演示文稿、网站横幅
- 3:4(竖屏)- 适合社交媒体、手机查看
- 是否生成封面图
- 是 - 生成封面图 + 内容配图
- 否 - 仅生成内容配图
- 指定配图数量
- 根据文档长度,Claude 会推荐合适的数量
- 你可以自定义需要的图片数量(建议 3-10 张)
- 确认内容归纳
- Claude 会展示归纳的主题列表
- 确认所有重要内容都被包含
- 可以要求调整归纳结果
- 生成配图
- 确认后,自动调用 Gemini API 生成图片
- 图片保存到文档所在目录的 images/ 文件夹
完整示例:
```
用户: 帮我为 ~/documents/ai-evolution.md 生成配图,用渐变玻璃风格
Claude: 好的,让我先读取这个文档...
[读取并分析文档内容]
检测到文档长度约 3000 字。
请选择图片比例:
1. 16:9 (横屏)
2. 3:4 (竖屏)
用户: 1
Claude: 是否生成封面图?
1. 是
2. 否
用户: 是
Claude: 期望生成多少张内容配图?
建议范围:3-10 张
根据文档内容,推荐生成 5 张
用户: 5
Claude: 📋 内容归纳完成
📄 封面图内容:
"AI 技术演化:从规则到智能"
- 核心概念、演化路径、最佳实践
📚 内容配图(共 5 张):
1. AI 技术的起源
2. 机器学习的突破
3. 深度学习革命
4. 大语言模型时代
5. 未来发展趋势
✓ 所有内容已覆盖,无遗漏
确认开始生成配图吗?(Y/N)
用户: Y
Claude: 🖼️ 开始生成配图...
正在生成封面图...
✓ 已保存: ~/documents/images/cover.png
正在生成第 1/5 张...
✓ 已保存: ~/documents/images/illustration-01.png
...
✨ 完成!共生成 6 张配图
```
方式 2: 直接使用 Python 脚本(高级用户)
如果你想要更多控制或进行批量处理,可以直接调用 Python 脚本。
单图生成:
```bash
python3 scripts/generate_single_image.py \
--title "人工智能的未来