# 抖音数据AI分析功能 ## 功能概述 本项目集成了阿里云百炼大模型,可以智能分析抖音视频数据,提供内容趋势、互动数据、创作者分析等多维度洞察。 ## 快速开始 ### 1. 安装依赖 ```bash pip install -r requirements.txt ``` ### 2. 配置API Key 创建 `.env` 文件(参考 `.env.example`): ```bash # 复制示例文件 cp .env.example .env # 编辑 .env 文件,填入你的API Key DASHSCOPE_API_KEY=your_actual_api_key_here DASHSCOPE_MODEL=qwen-plus ``` 或者在调用API时直接传入 `api_key` 参数。 ### 3. 获取阿里云百炼API Key 1. 访问 [阿里云百炼控制台](https://dashscope.console.aliyun.com/) 2. 登录/注册账号 3. 在"API-KEY管理"中创建新的API Key 4. 复制API Key到 `.env` 文件 ## 使用方式 ### 方式一:命令行工具 分析已有的JSON数据文件: ```bash python ai_analyzer.py --file douyin_data_soupce/douyin_data/douyin_creative_guidance_游戏_20260107_112545.json ``` 使用自定义提示词: ```bash python ai_analyzer.py \ --file douyin_data_soupce/douyin_data/douyin_creative_guidance_游戏_20260107_112545.json \ --prompt prompts/analyze_prompt.md \ --instruction "重点分析游戏类视频的爆款特征" ``` 保存分析结果: ```bash python ai_analyzer.py \ --file douyin_data_soupce/douyin_data/douyin_creative_guidance_游戏_20260107_112545.json \ --output analysis_result.txt ``` ### 方式二:API接口 启动API服务: ```bash python api.py ``` #### 接口1:分析视频数据(POST /api/analyze) 直接传入视频数据进行分析: ```bash curl -X POST "http://localhost:8001/api/analyze" \ -H "Content-Type: application/json" \ -d '{ "videos": [ { "author": "游戏主播A", "description": "王者荣耀新赛季上分技巧 #王者荣耀 #游戏攻略", "plays": "100万", "likes": "5万", "comments": "3000", "hashTags": ["#王者荣耀", "#游戏攻略"], "hotWords": ["上分", "新赛季"] } ], "custom_instruction": "重点分析互动率" }' ``` #### 接口2:分析JSON文件(POST /api/analyze-file) 从已保存的JSON文件读取数据并分析: ```bash curl -X POST "http://localhost:8001/api/analyze-file" \ -H "Content-Type: application/json" \ -d '{ "json_file": "douyin_data_soupce/douyin_data/douyin_creative_guidance_游戏_20260107_112545.json", "prompt_file": "prompts/analyze_prompt.md", "custom_instruction": "重点关注游戏类内容的创作趋势" }' ``` ### 方式三:Python代码集成 ```python from ai_analyzer import AIAnalyzer # 创建分析器 analyzer = AIAnalyzer(api_key="your_api_key", model="qwen-plus") # 方式1:分析视频列表 videos = [ { "author": "游戏主播A", "description": "王者荣耀新赛季上分技巧", "plays": "100万", "likes": "5万" } ] result = analyzer.analyze( videos=videos, prompt_file="prompts/analyze_prompt.md", custom_instruction="重点分析互动率" ) print(result["analysis"]) # 方式2:分析JSON文件 result = analyzer.analyze_from_file( json_file="douyin_data_soupce/douyin_data/douyin_creative_guidance_游戏_20260107_112545.json", prompt_file="prompts/analyze_prompt.md" ) print(result["analysis"]) ``` ## 提示词自定义 提示词文件位于 `prompts/analyze_prompt.md`,你可以根据需求修改: ```markdown # 抖音数据分析提示词 你是一个专业的抖音数据分析师... ## 分析任务 1. 内容趋势分析 2. 互动数据分析 3. 创作者分析 ... ``` 你也可以创建多个提示词文件用于不同的分析场景: - `prompts/analyze_prompt.md` - 通用分析 - `prompts/game_analysis.md` - 游戏类内容专项分析 - `prompts/trend_analysis.md` - 趋势预测分析 - `prompts/creator_analysis.md` - 创作者画像分析 ## API响应示例 ```json { "success": true, "analysis": "## 数据概览\n本次分析了50个游戏类视频...\n\n## 详细分析\n### 1. 内容趋势\n...", "model": "qwen-plus", "video_count": 50, "usage": { "input_tokens": 5000, "output_tokens": 1500, "total_tokens": 6500 } } ``` ## 完整工作流示例 ### 1. 抓取创作指导数据 ```bash curl -X POST "http://localhost:8001/api/creative-guidance" \ -H "Content-Type: application/json" \ -d '{"category": "游戏"}' ``` ### 2. 分析抓取的数据 ```bash curl -X POST "http://localhost:8001/api/analyze-file" \ -H "Content-Type: application/json" \ -d '{ "json_file": "douyin_data_soupce/douyin_data/douyin_creative_guidance_游戏_20260107_112545.json", "custom_instruction": "重点分析爆款视频特征,给出具体的创作建议" }' ``` ## 支持的模型 - `qwen-turbo` - 快速响应,适合简单分析 - `qwen-plus` - 平衡性能,推荐使用(默认) - `qwen-max` - 最强性能,适合复杂分析 - `qwen-long` - 超长文本,适合大量数据 ## 注意事项 1. **API Key安全**:不要将API Key提交到代码仓库,使用环境变量或 `.env` 文件 2. **Token消耗**:大量数据分析会消耗较多Token,注意控制成本 3. **数据隐私**:敏感数据请谨慎使用云端API 4. **请求频率**:注意API调用频率限制 ## 故障排查 ### 问题1:API Key错误 ``` ValueError: 未提供API Key ``` **解决方案**: - 检查 `.env` 文件是否存在且配置正确 - 或在API请求中传入 `api_key` 参数 ### 问题2:提示词文件不存在 ``` 提示词文件不存在: prompts/analyze_prompt.md ``` **解决方案**: - 确保 `prompts` 目录存在 - 检查文件路径是否正确 ### 问题3:JSON文件格式错误 ``` JSON文件中没有视频数据 ``` **解决方案**: - 确保JSON文件包含 `videos` 字段 - 检查数据格式是否正确 ## 更多资源 - [阿里云百炼文档](https://help.aliyun.com/zh/dashscope/) - [API参考](https://help.aliyun.com/zh/dashscope/developer-reference/api-details) - [模型介绍](https://help.aliyun.com/zh/dashscope/developer-reference/model-introduction)