AI Analyst —— 会自己建模的数据分析 Agent
一个 LLM 当分析师:用 Function-Calling 编排工具——Text2SQL(create_sql_agent)从 MySQL 拉特征,再现场拟合可解释模型(线性回归拆解客单 + 决策树找驱动因子),最后给可执行建议。净新角度是「LLM 自己建模」,不是 NL→SQL→图表。
一个 LLM 当分析师,不只是 NL→SQL 翻译器。在一个园区餐饮业务问题上,看它用 Function-Calling 编排工具:Text2SQL(create_sql_agent)拉特征,再自己拟合可解释模型——LinearRegression 拆解客单、DecisionTreeRegressor(max_depth=4) + export_text 找驱动因子——最后给出建议。
本地版本说明
工具、库与模型(create_sql_agent + SQLDatabaseToolkit + LinearRegression / DecisionTreeRegressor + deepseek)来自课程的真实代码。复演里的 SQL、系数与决策树规则用的是说明性数值(已标注);58 节视频没有字幕,所以这里以代码为锚,不编造任何指标。
运行 AI Analyst 工具编排
一个 LLM 当分析师:自己写 SQL 拉特征(Text2SQL)→ 自己拟合可解释模型(线性回归拆解客单 + 决策树找驱动因子)→ 给出可执行建议。看它逐步调用工具。
业务问题
哪些因素在驱动园区餐饮的客单消费?给一条可执行建议。
agent.plan (Function-Calling)
deepseek-chat / Qwen-Agent reads the question → decides: pull features, then fit an interpretable model.
text2sql_tool
LangChain create_sql_agent + SQLDatabaseToolkit → introspect schema → emit + run SQL on the MySQL business DB.
auto_model_tool · LinearRegression
Decompose per-capita F&B spend into normal / card / promo terms → read the coefficients.
auto_model_tool · DecisionTreeRegressor(max_depth=4)
export_text / plot_tree → which factors drive revenue: events / holidays / ticket-price / promo / weather.
agent.summarize
Turn coefficients + tree rules into a human-readable recommendation.
执行日志
运行分析,看 LLM 逐个调用工具:写 SQL → 拟合模型 → 给建议。
工具产出
建议体验
运行分析,跟着工具调用走:规划 → Text2SQL → 拟合线性 → 拟合树 → 给建议。
看 create_sql_agent 生成的 SQL,再看 LinearRegression 对客单的拆解(正常 / 储值卡 / 促销 三项)。
看 DecisionTreeRegressor(max_depth=4) 的驱动因子规则 + 特征重要度,以及它们如何变成一条建议。
这个试玩能说明什么
你能让 LLM 当分析师——拉数据、自己建模、读出驱动因子、给建议——而不只是把 NL 翻译成 SQL。
你刻意选可解释模型(线性回归 + 浅决策树),让系数和 if-else 规则能讲给业务方听。
你设计工具编排:Text2SQL 和自动建模拆成独立的 Function-Calling 工具,由 LLM 自己排顺序。
净新角度
LLM 自动拟合可解释模型(回归 + 树)并给建议——不是 NL→SQL→图表
技术栈
Function-Calling(deepseek-chat / Qwen-Agent)· LangChain create_sql_agent + SQLDatabaseToolkit · scikit-learn
模型
LinearRegression(拆解客单)+ DecisionTreeRegressor(max_depth=4) + export_text