@howie_serious: llm在操作电脑这件事上，确实已经接近人类水平了。 OSWorld benchmark，测试的就是 llm 像人类一样操作电脑的能力，例如 office 套件、浏览网页、填写网页表单。人类的基准...