RTutor 0.98:自然语言到R代码的智能翻译工具

介绍:

RTutor 0.98利用OpenAI的强大语言模型,将自然语言翻译成R代码并执行。用户只需上传数据文件,通过简单的英语提问即可完成数据分析,并能在几分钟内下载HTML报告。适用于有一定R语言基础的用户,帮助他们快速生成代码,提高工作效率。

记录:

2024-07-01

每月访客数:

26.6K

RTutor

RTutor 产品信息

RTutor 0.98

什么是RTutor

RTutor是一款基于人工智能的应用程序,用户可以通过自然语言与数据进行交互。上传数据集后,用户可以用英语提问或请求分析,RTutor会生成并运行R代码,以图表和数值结果回答问题。

特点

  • 使用OpenAI的强大语言模型将自然语言翻译成R代码并执行。
  • 支持上传CSV、TSV和Excel格式的数据文件。
  • 分析结果可以在几分钟内生成HTML报告下载。
  • 用户数据不会上传到OpenAI,只会发送列名以生成R代码。
  • 提供免费的非营利组织使用,商业用途需获得许可。

使用场景

RTutor适用于那些有一定R语言基础的用户,通过快速生成代码来学习R或提高生产力。用户可以使用RTutor来快速进行数据可视化和探索性数据分析(EDA),尽管生成的代码可能需要进一步测试和调整。

常见问题

什么是RTutor?

RTutor是一款基于人工智能的应用程序,用户可以通过自然语言与数据进行交互。

RTutor如何工作?

用户的请求会被结构化并发送到OpenAI的AI系统,该系统返回R代码。R代码在Shiny环境中清理并执行,显示结果或错误信息。多个请求会记录在R Markdown文件中,方便记录和重复操作。

我的数据会上传到OpenAI吗?

不会。只有数据的列名会发送到OpenAI,数据本身不会存储在我们的服务器上。

RTutor适合谁使用?

主要目标是帮助有一定R语言经验的人学习R或提高生产力。RTutor可以快速生成代码草稿供测试和完善。

如何确保结果的正确性?

可以尝试不同的措辞或多次请求,并使用更高的温度参数获得多样的选择,然后用户可以自行检查是否获得相同的结果。

可以用RTutor完成R编程作业吗?

不行。这样会违背学习R编程的目的。用户需要通过学习R编程来判断生成的代码是否正确。

私人公司可以使用RTutor吗?

不可以。RTutor网站和源代码仅供非营利组织免费使用,并根据CC NC 3.0许可证分发。

可以在本地运行RTutor吗?

可以。下载R包并在本地安装,然后需要从OpenAI获得API密钥。

为什么相同的请求会得到不同的结果?

OpenAI的语言模型具有一定的随机性,可以通过称为“温度”的参数进行调整。可以在设置中进行设置。

没有R编程经验的人可以使用RTutor进行统计分析吗?

不完全可以。因为生成的代码可能有误。但可以快速进行数据可视化和探索性数据分析(EDA),但需注意这是实验性技术。

这个工具可以替代统计学家或数据科学家吗?

不能。但RTutor可以提高他们的效率。

如何有效地编写请求?

想象你有一个实习生,一个修过一学期统计学和R语言的大学生。你通过邮件发送指示,他/她回送代码和结果。实习生缺乏经验,容易出错,但工作努力。由于有了AI,这个实习生速度极快且几乎免费。

可以在AI生成的代码中安装R包吗?

不能。但我们正在努力预安装所有R包!目前我们已经完成了最常用的5000个R包。你的常用包很可能已经安装。

可以向网站上传大文件吗?

如果超过10MB则不行。尝试获取一小部分数据,上传到网站以获取代码,然后可以在本地运行。或者,下载RTutor R包并在自己的电脑上使用。

语音输入不起作用!

主要原因之一是你的浏览器阻止网站访问麦克风。确保你通过https://RTutor.ai访问网站。在http下,Chrome会自动阻止麦克风访问。靠近麦克风说话。确保只有一个浏览器标签页使用麦克风。

这是你的照片吗?

不是。我是一个老家伙。这张照片是由AI合成的。使用提示词“statistics tutor”,图像由Stable Diffusion 2.0生成。如果仔细看,你会发现她的手指是错乱的。

更新日志

  • 2024年4月26日:默认使用2024年4月9日的最新GPT-4V模型。
  • v0.98.4 2024年3月2日:在提示中添加几行数据。
  • v0.98.3 2023年11月1日:修复当目标变量是分类变量或未指定时EDA报告的问题。
  • v0.98.2 2023年11月1日:全面的EDA报告!
  • v0.98 2023年10月28日:询问代码和错误问题。第二次数据文件上传。
  • v0.97 2023年10月23日:GPT-4成为默认。优先使用ggplot2绘图。使用R环境启用连续数据操作。
  • v0.96 2023年9月26日:在所有请求中包含列名。GPT-4可用。
  • v0.95 2023年6月11日:ChatGPT(gpt-3.5-turbo)成为默认模型。
  • v0.94 2023年4月21日:使用CanvasXpress进行互动绘图。
  • v0.93 2023年3月26日:更改数据类型。添加数据描述。改进语音输入。
  • v0.92 2023年3月8日:在提示中包含数据结构描述。
  • v0.91 2023年2月6日:改进语音输入。只需启用麦克风并说Tutor...
  • v0.90 2023年1月15日:除了R代码外,还生成并运行Python代码!
  • v0.8.6 2023年1月8日:添加因子水平的描述。
  • v0.8.5 2023年1月6日:多种外语演示。
  • v0.8.4 2023年1月5日:收集用户反馈。
  • v0.8.3 2023年1月5日:收集一些用户数据以供改进。
  • v0.8.2 2023年1月4日:自动将第一列转换为行名。
  • v0.8.1 2023年1月3日:选择将一些唯一值较少的数值列转换为因子。
  • v0.8.0 2023年1月3日:添加列的描述(数值型与分类型)。
  • v0.7.6 2022年12月31日:添加RNA-seq数据和示例请求。
  • v0.7.5 2022年12月31日:重新设计用户界面。
  • v0.7 2022年12月27日:添加EDA选项卡。
  • v0.6 2022年12月27日:记录所有代码片段以便重用和报告。
  • v0.5 2022年12月24日:保留当前代码并继续。
  • v0.4 2022年12月23日:互动绘图。语音输入可选。
  • v0.3 2022年12月20日:添加语音识别。
  • V0.2 2022年12月16日:添加温度控制。服务器重启提醒。
  • V0.1 2022年12月11日:初始发布。
Loading related products...