Skip to content

update 4th team #18

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Merged
merged 1 commit into from
Jul 24, 2025
Merged
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
22 changes: 22 additions & 0 deletions 4th/4th_ai_powered_ops/task_1.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,22 @@
# 第一次任务 (发布于 2025-07-17)

## 个人任务
1. 本地开发环境的搭建
- 产出:开发第一个demo程序,并可运行。
2. 熟悉1个运营场景的问题定位链路
- 了解运维场景的调研路径,了解Prometheus、Superset平台、实例机器登陆日志查询
- 产出:运营场景分析链路记录。

## 团队任务
1. 深度调研如何用好AI编程工具
- 参考文档:
- https://yuanchuangai.com/#/tips/cursor/promote
- https://news.qq.com/rain/a/20250624A023IF00
- 产出:
- AI编程工具使用说明文档
2. 数据平台拉取小程序
- 产出:
- 拉取Prometheus、Superset平台数据的demo程序
3. 运维场景深入调研
- 产出:
- 2个典型应用场景的分析链路说明
18 changes: 18 additions & 0 deletions 4th/4th_ai_powered_ops/task_2.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,18 @@
# 第二次任务

## 团队任务
1. MCP数据拉取
1. 实现prometheus和superset的数据抓取功能,并封装为mcp服务
2. 和算法同学对齐数据格式
3. 学习现有的较完善mcp协议代码,重构自身代码,提高可读性和可扩展性
4. 跟进其他方向成员的方向,了解业务需求,提出初步的接口设计方案
2. 数据预处理
1. 算法调研与选型。收集时间序列数据异常值检测算法,需要涵盖统计模型、机器学习、深度学习。标注每类算法适用的异常类型与场景,最后给出3种可能最适合的算法。
2. 数据工程与特征分析。从Prometheus或Superset拉取历史数据,例如CPU、内存、磁盘IO等关键指标,至少包含2个业务周期。
3. Agent框架
1. 调研agent框架,了解各agent框架的特征,给出适应性场景与思考
2. 根据运维场景,初步构建demo版本的agent框架设计,进行框架搭建并测试
4. 知识库构建
1. 深入调研当前知识库搭建的主流技术、主流模式,了解它的应用场景,并记录自己的思考,产出调研文档
1. 对知识图谱基本作用、数据结构、使用方式等进行详细深入了解,记录进调研文档。需要进一步打开思路,完整的调研主流技术
2. 了解运维场景,初步形成知识库的构成部分、确定适合运维场景的知识库搭建模式
16 changes: 16 additions & 0 deletions 4th/4th_ai_powered_ops/topic.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,16 @@
智能运维 - 利用大模型实现智能监控与告警根因分析

### 目标

利用最新的AI大模型能力开发智能运维系统,实现:
- 指标巡检与指标异常辨识
- 线上问题下钻分析、
- 定期生成指标数据报表

实现及时发现潜在问题,更快定位运维问题根因

### 阶段任务

查看本目录下的 `task_*.md`

### 相关信息