You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
6.0 KiB
6.0 KiB
抖音数据AI分析功能
功能概述
本项目集成了阿里云百炼大模型,可以智能分析抖音视频数据,提供内容趋势、互动数据、创作者分析等多维度洞察。
快速开始
1. 安装依赖
pip install -r requirements.txt
2. 配置API Key
创建 .env 文件(参考 .env.example):
# 复制示例文件
cp .env.example .env
# 编辑 .env 文件,填入你的API Key
DASHSCOPE_API_KEY=your_actual_api_key_here
DASHSCOPE_MODEL=qwen-plus
或者在调用API时直接传入 api_key 参数。
3. 获取阿里云百炼API Key
- 访问 阿里云百炼控制台
- 登录/注册账号
- 在"API-KEY管理"中创建新的API Key
- 复制API Key到
.env文件
使用方式
方式一:命令行工具
分析已有的JSON数据文件:
python ai_analyzer.py --file douyin_data_soupce/douyin_data/douyin_creative_guidance_游戏_20260107_112545.json
使用自定义提示词:
python ai_analyzer.py \
--file douyin_data_soupce/douyin_data/douyin_creative_guidance_游戏_20260107_112545.json \
--prompt prompts/analyze_prompt.md \
--instruction "重点分析游戏类视频的爆款特征"
保存分析结果:
python ai_analyzer.py \
--file douyin_data_soupce/douyin_data/douyin_creative_guidance_游戏_20260107_112545.json \
--output analysis_result.txt
方式二:API接口
启动API服务:
python api.py
接口1:分析视频数据(POST /api/analyze)
直接传入视频数据进行分析:
curl -X POST "http://localhost:8001/api/analyze" \
-H "Content-Type: application/json" \
-d '{
"videos": [
{
"author": "游戏主播A",
"description": "王者荣耀新赛季上分技巧 #王者荣耀 #游戏攻略",
"plays": "100万",
"likes": "5万",
"comments": "3000",
"hashTags": ["#王者荣耀", "#游戏攻略"],
"hotWords": ["上分", "新赛季"]
}
],
"custom_instruction": "重点分析互动率"
}'
接口2:分析JSON文件(POST /api/analyze-file)
从已保存的JSON文件读取数据并分析:
curl -X POST "http://localhost:8001/api/analyze-file" \
-H "Content-Type: application/json" \
-d '{
"json_file": "douyin_data_soupce/douyin_data/douyin_creative_guidance_游戏_20260107_112545.json",
"prompt_file": "prompts/analyze_prompt.md",
"custom_instruction": "重点关注游戏类内容的创作趋势"
}'
方式三:Python代码集成
from ai_analyzer import AIAnalyzer
# 创建分析器
analyzer = AIAnalyzer(api_key="your_api_key", model="qwen-plus")
# 方式1:分析视频列表
videos = [
{
"author": "游戏主播A",
"description": "王者荣耀新赛季上分技巧",
"plays": "100万",
"likes": "5万"
}
]
result = analyzer.analyze(
videos=videos,
prompt_file="prompts/analyze_prompt.md",
custom_instruction="重点分析互动率"
)
print(result["analysis"])
# 方式2:分析JSON文件
result = analyzer.analyze_from_file(
json_file="douyin_data_soupce/douyin_data/douyin_creative_guidance_游戏_20260107_112545.json",
prompt_file="prompts/analyze_prompt.md"
)
print(result["analysis"])
提示词自定义
提示词文件位于 prompts/analyze_prompt.md,你可以根据需求修改:
# 抖音数据分析提示词
你是一个专业的抖音数据分析师...
## 分析任务
1. 内容趋势分析
2. 互动数据分析
3. 创作者分析
...
你也可以创建多个提示词文件用于不同的分析场景:
prompts/analyze_prompt.md- 通用分析prompts/game_analysis.md- 游戏类内容专项分析prompts/trend_analysis.md- 趋势预测分析prompts/creator_analysis.md- 创作者画像分析
API响应示例
{
"success": true,
"analysis": "## 数据概览\n本次分析了50个游戏类视频...\n\n## 详细分析\n### 1. 内容趋势\n...",
"model": "qwen-plus",
"video_count": 50,
"usage": {
"input_tokens": 5000,
"output_tokens": 1500,
"total_tokens": 6500
}
}
完整工作流示例
1. 抓取创作指导数据
curl -X POST "http://localhost:8001/api/creative-guidance" \
-H "Content-Type: application/json" \
-d '{"category": "游戏"}'
2. 分析抓取的数据
curl -X POST "http://localhost:8001/api/analyze-file" \
-H "Content-Type: application/json" \
-d '{
"json_file": "douyin_data_soupce/douyin_data/douyin_creative_guidance_游戏_20260107_112545.json",
"custom_instruction": "重点分析爆款视频特征,给出具体的创作建议"
}'
支持的模型
qwen-turbo- 快速响应,适合简单分析qwen-plus- 平衡性能,推荐使用(默认)qwen-max- 最强性能,适合复杂分析qwen-long- 超长文本,适合大量数据
注意事项
- API Key安全:不要将API Key提交到代码仓库,使用环境变量或
.env文件 - Token消耗:大量数据分析会消耗较多Token,注意控制成本
- 数据隐私:敏感数据请谨慎使用云端API
- 请求频率:注意API调用频率限制
故障排查
问题1:API Key错误
ValueError: 未提供API Key
解决方案:
- 检查
.env文件是否存在且配置正确 - 或在API请求中传入
api_key参数
问题2:提示词文件不存在
提示词文件不存在: prompts/analyze_prompt.md
解决方案:
- 确保
prompts目录存在 - 检查文件路径是否正确
问题3:JSON文件格式错误
JSON文件中没有视频数据
解决方案:
- 确保JSON文件包含
videos字段 - 检查数据格式是否正确