Phân tích Project89: Một khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao
Project89 đã đề xuất một thiết kế khung tác nhân hoàn toàn mới, đây là một khung tác nhân hiệu suất cao hướng tới phát triển trò chơi, so với các giải pháp hiện có, nó có lợi thế về tính mô-đun và hiệu suất tốt hơn.
Bài viết này sẽ phân tích sâu về thiết kế khung của Project89, khám phá những điểm đổi mới của nó so với khung Agent truyền thống.
Nền tảng nhà phát triển
Người sáng lập Project89 trước đây đã tham gia phát triển dự án Magick, một phần mềm sử dụng AI để lập trình. Ông là một trong những nhà phát triển cốt lõi của dự án, xếp hạng thứ tư. Điều này thể hiện sức mạnh kỹ thuật của người sáng lập trong lĩnh vực AI.
Tại sao chọn kiến trúc ECS
ECS(Entity-Component-System) kiến trúc được áp dụng rộng rãi trong phát triển trò chơi và hệ thống mô phỏng. Hiện tại, các trò chơi sử dụng kiến trúc ECS bao gồm:
Trò chơi blockchain: Mud, Dojo
Trò chơi truyền thống: Overwatch, Star Citizen, v.v.
Các công cụ phát triển game chính như Unity cũng đang tiến hóa theo hướng ECS.
Cấu trúc lõi của kiến trúc ECS:
Entity(实体): chỉ là một ID, không chứa dữ liệu hoặc logic
Component( thành phần ): lưu trữ dữ liệu hoặc trạng thái cụ thể của thực thể.
Hệ thống(hệ thống): thực hiện logic liên quan đến một số thành phần
Trong ArgOS, mỗi Agent được coi là một Entity, có thể đăng ký các thành phần khác nhau, chẳng hạn như:
Thành phần đại lý: Lưu trữ thông tin cơ bản của đại lý
Thành phần nhận thức: Lưu trữ dữ liệu từ môi trường bên ngoài đã được cảm nhận.
Thành phần bộ nhớ: Dữ liệu nhớ của Agent lưu trữ
Action Component: Lưu trữ dữ liệu hành động cần thực hiện
Ví dụ về quy trình làm việc của Hệ thống:
Hệ thống nhận thức cập nhật dữ liệu mà Agent cảm nhận được
Hệ thống bộ nhớ sẽ lưu trữ dữ liệu cảm nhận vào cơ sở dữ liệu
Hệ thống Hành động thực hiện các hành động tương ứng theo ký ức
Cuối cùng nhận được Agent Entity đã được cập nhật
Trong Project89 có nhiều loại Agent khác nhau, có thể mở rộng khả năng của Agent bằng cách thêm các thành phần khác nhau, chẳng hạn như Planning Component.
Kiến trúc Hệ thống ArgOS
ArgOS được thiết kế với nhiều Component và System để cho Agent thực hiện các nhiệm vụ phức tạp hơn.
Hệ thống được chia thành ba cấp độ:
Có ý thức(CONSCIOUS)hệ thống
Bao gồm RoomSystem, PerceptionSystem, ExperienceSystem, v.v.
Tần suất cập nhật cao, như mỗi 10 giây
Xử lý nhận thức thời gian thực, suy nghĩ, thực hiện hành động, v.v.
Tiềm thức(HỆ THỐNG TIỀM THỨC)
Bao gồm GoalPlanningSystem, PlanningSystem
Tần suất cập nhật thấp, chẳng hạn như mỗi 25 giây
Xử lý mục tiêu tạo ra và lập kế hoạch khác
Vô thức(UNCONSCIOUS)hệ thống
Hiện tại chưa được kích hoạt
Tần suất cập nhật chậm hơn, như trên 50 giây
Mối quan hệ giữa các hệ thống rất phức tạp, chủ yếu bao gồm:
PerceptionSystem: Thu thập kích thích từ bên ngoài, cập nhật vào thành phần Perception
ExperienceSystem: Chuyển đổi kích thích thành kinh nghiệm, lưu trữ vào thành phần Memory
ThinkingSystem: Tạo ra kết quả suy nghĩ, có thể kích hoạt hành động mới hoặc thay đổi ngoại hình
ActionSystem: Thực hiện hành động, cập nhật kết quả và tạo ra kích thích nhận thức
GoalPlanningSystem: Đánh giá tiến độ mục tiêu, tạo ra mục tiêu mới
PlanningSystem: Tạo kế hoạch thực hiện cho mục tiêu
RoomSystem: Xử lý cập nhật liên quan đến phòng
CleanupSystem: loại bỏ thực thể không cần thiết
Phân tích kiến trúc tổng thể của ArgOS
Kiến trúc lõi phân lớp
Kiến trúc cốt lõi của ArgOS được chia thành nhiều cấp độ: thành phần, hệ thống, trình quản lý và thời gian chạy.
Phân loại thành phần
Các thành phần có thể được phân loại thành các loại sau:
Danh tính cốt lõi: Agent, PlayerProfile, v.v.
Hành vi và trạng thái: Hành động, Mục tiêu, Kế hoạch, v.v.
Cảm nhận và trí nhớ: Perception, Memory, v.v.
Lớp môi trường và không gian: Room, OccupiesRoom, v.v.
Ngoại hình và tương tác: Appearance, UIState, v.v.
Loại hỗ trợ hoặc vận hành: Cleanup, DebugInfo, v.v.
Kiến trúc hệ thống
Nội dung trước đã được giới thiệu chi tiết.
Kiến trúc Quản lý
Manager như một nhà quản lý tài nguyên, cung cấp các chức năng sau:
RoomManager: Quản lý thông tin phòng
StateManager: Quản lý thế giới / Trạng thái đại lý
EventBus: phát hành và đăng ký sự kiện
ActionManager: Quản lý thực hiện hành động
PromptManager: Quản lý từ khóa gợi ý LLM
Tương tác cơ sở dữ liệu
Thông qua StateManager để thực hiện sự tương tác giữa ECS và cơ sở dữ liệu:
Tải dữ liệu cốt lõi khi khởi động
Đọc và ghi dữ liệu theo nhu cầu trong thời gian thực
Thực hiện lưu trữ định kỳ hoặc theo sự kiện
Lưu tất cả dữ liệu khi thoát
Điểm đổi mới trong kiến trúc
Các hệ thống hoạt động độc lập, không có mối quan hệ gọi lẫn nhau, đạt được mức độ tách biệt cao.
Dễ dàng mở rộng và cắt gọt, có thể tăng giảm Component và System theo nhu cầu
Hiệu suất vượt trội hơn kiến trúc đối tượng truyền thống, thích hợp hơn cho xử lý đồng thời
Chia hệ thống thành các tầng nhận thức, thực hiện việc lập lịch thực thi với tần suất khác nhau
Tổng thể mà nói, Project89 cung cấp một khung Agent có độ mô-đun cao, hiệu suất xuất sắc và thiết kế tinh tế, mang đến cho các đội ngũ phát triển trò chơi và DeAI những lựa chọn kiến trúc mới.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Project89: Phân tích khung AI Agent thế hệ tiếp theo hiệu suất cao theo mô-đun
Phân tích Project89: Một khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao
Project89 đã đề xuất một thiết kế khung tác nhân hoàn toàn mới, đây là một khung tác nhân hiệu suất cao hướng tới phát triển trò chơi, so với các giải pháp hiện có, nó có lợi thế về tính mô-đun và hiệu suất tốt hơn.
Bài viết này sẽ phân tích sâu về thiết kế khung của Project89, khám phá những điểm đổi mới của nó so với khung Agent truyền thống.
Nền tảng nhà phát triển
Người sáng lập Project89 trước đây đã tham gia phát triển dự án Magick, một phần mềm sử dụng AI để lập trình. Ông là một trong những nhà phát triển cốt lõi của dự án, xếp hạng thứ tư. Điều này thể hiện sức mạnh kỹ thuật của người sáng lập trong lĩnh vực AI.
Tại sao chọn kiến trúc ECS
ECS(Entity-Component-System) kiến trúc được áp dụng rộng rãi trong phát triển trò chơi và hệ thống mô phỏng. Hiện tại, các trò chơi sử dụng kiến trúc ECS bao gồm:
Cấu trúc lõi của kiến trúc ECS:
Trong ArgOS, mỗi Agent được coi là một Entity, có thể đăng ký các thành phần khác nhau, chẳng hạn như:
Ví dụ về quy trình làm việc của Hệ thống:
Trong Project89 có nhiều loại Agent khác nhau, có thể mở rộng khả năng của Agent bằng cách thêm các thành phần khác nhau, chẳng hạn như Planning Component.
Kiến trúc Hệ thống ArgOS
ArgOS được thiết kế với nhiều Component và System để cho Agent thực hiện các nhiệm vụ phức tạp hơn.
Hệ thống được chia thành ba cấp độ:
Có ý thức(CONSCIOUS)hệ thống
Tiềm thức(HỆ THỐNG TIỀM THỨC)
Vô thức(UNCONSCIOUS)hệ thống
Mối quan hệ giữa các hệ thống rất phức tạp, chủ yếu bao gồm:
Phân tích kiến trúc tổng thể của ArgOS
Kiến trúc cốt lõi của ArgOS được chia thành nhiều cấp độ: thành phần, hệ thống, trình quản lý và thời gian chạy.
Các thành phần có thể được phân loại thành các loại sau:
Nội dung trước đã được giới thiệu chi tiết.
Manager như một nhà quản lý tài nguyên, cung cấp các chức năng sau:
Thông qua StateManager để thực hiện sự tương tác giữa ECS và cơ sở dữ liệu:
Điểm đổi mới trong kiến trúc
Các hệ thống hoạt động độc lập, không có mối quan hệ gọi lẫn nhau, đạt được mức độ tách biệt cao.
Dễ dàng mở rộng và cắt gọt, có thể tăng giảm Component và System theo nhu cầu
Hiệu suất vượt trội hơn kiến trúc đối tượng truyền thống, thích hợp hơn cho xử lý đồng thời
Chia hệ thống thành các tầng nhận thức, thực hiện việc lập lịch thực thi với tần suất khác nhau
Tổng thể mà nói, Project89 cung cấp một khung Agent có độ mô-đun cao, hiệu suất xuất sắc và thiết kế tinh tế, mang đến cho các đội ngũ phát triển trò chơi và DeAI những lựa chọn kiến trúc mới.