You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
 

6.0 KiB

抖音数据AI分析功能

功能概述

本项目集成了阿里云百炼大模型,可以智能分析抖音视频数据,提供内容趋势、互动数据、创作者分析等多维度洞察。

快速开始

1. 安装依赖

pip install -r requirements.txt

2. 配置API Key

创建 .env 文件(参考 .env.example):

# 复制示例文件
cp .env.example .env

# 编辑 .env 文件,填入你的API Key
DASHSCOPE_API_KEY=your_actual_api_key_here
DASHSCOPE_MODEL=qwen-plus

或者在调用API时直接传入 api_key 参数。

3. 获取阿里云百炼API Key

  1. 访问 阿里云百炼控制台
  2. 登录/注册账号
  3. 在"API-KEY管理"中创建新的API Key
  4. 复制API Key到 .env 文件

使用方式

方式一:命令行工具

分析已有的JSON数据文件:

python ai_analyzer.py --file douyin_data_soupce/douyin_data/douyin_creative_guidance_游戏_20260107_112545.json

使用自定义提示词:

python ai_analyzer.py \
  --file douyin_data_soupce/douyin_data/douyin_creative_guidance_游戏_20260107_112545.json \
  --prompt prompts/analyze_prompt.md \
  --instruction "重点分析游戏类视频的爆款特征"

保存分析结果:

python ai_analyzer.py \
  --file douyin_data_soupce/douyin_data/douyin_creative_guidance_游戏_20260107_112545.json \
  --output analysis_result.txt

方式二:API接口

启动API服务:

python api.py

接口1:分析视频数据(POST /api/analyze)

直接传入视频数据进行分析:

curl -X POST "http://localhost:8001/api/analyze" \
  -H "Content-Type: application/json" \
  -d '{
    "videos": [
      {
        "author": "游戏主播A",
        "description": "王者荣耀新赛季上分技巧 #王者荣耀 #游戏攻略",
        "plays": "100万",
        "likes": "5万",
        "comments": "3000",
        "hashTags": ["#王者荣耀", "#游戏攻略"],
        "hotWords": ["上分", "新赛季"]
      }
    ],
    "custom_instruction": "重点分析互动率"
  }'

接口2:分析JSON文件(POST /api/analyze-file)

从已保存的JSON文件读取数据并分析:

curl -X POST "http://localhost:8001/api/analyze-file" \
  -H "Content-Type: application/json" \
  -d '{
    "json_file": "douyin_data_soupce/douyin_data/douyin_creative_guidance_游戏_20260107_112545.json",
    "prompt_file": "prompts/analyze_prompt.md",
    "custom_instruction": "重点关注游戏类内容的创作趋势"
  }'

方式三:Python代码集成

from ai_analyzer import AIAnalyzer

# 创建分析器
analyzer = AIAnalyzer(api_key="your_api_key", model="qwen-plus")

# 方式1:分析视频列表
videos = [
    {
        "author": "游戏主播A",
        "description": "王者荣耀新赛季上分技巧",
        "plays": "100万",
        "likes": "5万"
    }
]

result = analyzer.analyze(
    videos=videos,
    prompt_file="prompts/analyze_prompt.md",
    custom_instruction="重点分析互动率"
)

print(result["analysis"])

# 方式2:分析JSON文件
result = analyzer.analyze_from_file(
    json_file="douyin_data_soupce/douyin_data/douyin_creative_guidance_游戏_20260107_112545.json",
    prompt_file="prompts/analyze_prompt.md"
)

print(result["analysis"])

提示词自定义

提示词文件位于 prompts/analyze_prompt.md,你可以根据需求修改:

# 抖音数据分析提示词

你是一个专业的抖音数据分析师...

## 分析任务
1. 内容趋势分析
2. 互动数据分析
3. 创作者分析
...

你也可以创建多个提示词文件用于不同的分析场景:

  • prompts/analyze_prompt.md - 通用分析
  • prompts/game_analysis.md - 游戏类内容专项分析
  • prompts/trend_analysis.md - 趋势预测分析
  • prompts/creator_analysis.md - 创作者画像分析

API响应示例

{
  "success": true,
  "analysis": "## 数据概览\n本次分析了50个游戏类视频...\n\n## 详细分析\n### 1. 内容趋势\n...",
  "model": "qwen-plus",
  "video_count": 50,
  "usage": {
    "input_tokens": 5000,
    "output_tokens": 1500,
    "total_tokens": 6500
  }
}

完整工作流示例

1. 抓取创作指导数据

curl -X POST "http://localhost:8001/api/creative-guidance" \
  -H "Content-Type: application/json" \
  -d '{"category": "游戏"}'

2. 分析抓取的数据

curl -X POST "http://localhost:8001/api/analyze-file" \
  -H "Content-Type: application/json" \
  -d '{
    "json_file": "douyin_data_soupce/douyin_data/douyin_creative_guidance_游戏_20260107_112545.json",
    "custom_instruction": "重点分析爆款视频特征,给出具体的创作建议"
  }'

支持的模型

  • qwen-turbo - 快速响应,适合简单分析
  • qwen-plus - 平衡性能,推荐使用(默认)
  • qwen-max - 最强性能,适合复杂分析
  • qwen-long - 超长文本,适合大量数据

注意事项

  1. API Key安全:不要将API Key提交到代码仓库,使用环境变量或 .env 文件
  2. Token消耗:大量数据分析会消耗较多Token,注意控制成本
  3. 数据隐私:敏感数据请谨慎使用云端API
  4. 请求频率:注意API调用频率限制

故障排查

问题1:API Key错误

ValueError: 未提供API Key

解决方案

  • 检查 .env 文件是否存在且配置正确
  • 或在API请求中传入 api_key 参数

问题2:提示词文件不存在

提示词文件不存在: prompts/analyze_prompt.md

解决方案

  • 确保 prompts 目录存在
  • 检查文件路径是否正确

问题3:JSON文件格式错误

JSON文件中没有视频数据

解决方案

  • 确保JSON文件包含 videos 字段
  • 检查数据格式是否正确

更多资源