OpenAI zaprezentowało nowe narzędzia programistyczne dla twórców aplikacji biznesowych do tworzenia agentów AI dostosowanych do konkretnych potrzeb klientów. Narzędzia te łączą w sobie wiele funkcji z oferty AI OpenAI, upraszczając programowanie agentów.
Chatboty AI, takie jak ChatGPT firmy OpenAI, stały się popularne, ponieważ mogą odpowiadać na pytania zadawane im przez ludzi. Jednak te chatboty są ograniczone do głównie prostych pytań, które nie wymagają głębokiego myślenia i badań, takich jak "Jaka jest wysokość Tokyo Tower?" Te chatboty generalnie zależą od informacji, na których zostały przeszkolone i mają ograniczoną zdolność do syntetyzowania odpowiedzi.
Sztuczna inteligencja agentowa może surfować po Internecie w poszukiwaniu informacji i korzystać z komputera jak człowiek podczas badania złożonego zapytania, takiego jak "Stwórz plan podróży do Tokio, który obejmuje popularne sklepy anime i miejsca z budżetem 2000 USD" Sztuczna inteligencja może dogłębnie badać, a następnie myśleć o rozwiązywaniu złożonych podpowiedzi.
Aby zbudować tych agentów AI, OpenAI stworzyło Research API, aby umożliwić programistom tworzenie agentów za pomocą zaledwie kilku wierszy kodu. Nowe API opiera się na wersji beta Assistants API, a informacje zwrotne zostały wykorzystane do poprawy łatwości użytkowania i szybkości. Research API jest supersetem obecnego Chat Completions API, który tworzy odpowiedzi tekstowe z podpowiedzi i jest nowym zalecanym przez firmę API do użycia. Interfejs API Assistants zostanie wycofany w 2026 roku.
OpenAI wydało również Agents SDK, aby pomóc programistom w tworzeniu przepływów pracy z wieloma agentami, w których jeden wyspecjalizowany agent współpracuje z innymi w celu obsługi żądań klientów. Na przykład, jeden agent może kierować żądania zwrotu produktu do agenta zwrotów, a żądania pomysłów na zakupy do agenta zakupów.
Źródło(a)
11 marca 2025 r
Produkt
Nowe narzędzia do tworzenia agentów
Rozwijamy naszą platformę, aby pomóc deweloperom i przedsiębiorstwom w tworzeniu użytecznych i niezawodnych agentów.
Proszę wypróbować w Playground(otwiera się w nowym oknie)
Elegancki, minimalistyczny interfejs wyświetlający listę zadań dla agenta AI, w tym "triage_agent", "guardrail" i "update_salesforce_record", na płynnym niebieskim abstrakcyjnym tle.
Dziś publikujemy pierwszy zestaw bloków konstrukcyjnych, które pomogą programistom i przedsiębiorstwom tworzyć użytecznych i niezawodnych agentów. Postrzegamy agentów jako systemy, które niezależnie wykonują zadania w imieniu użytkowników. W ciągu ostatniego roku wprowadziliśmy nowe możliwości modeli - takie jak zaawansowane rozumowanie, interakcje multimodalne i nowe techniki bezpieczeństwa - które położyły podwaliny pod nasze modele do obsługi złożonych, wieloetapowych zadań wymaganych do tworzenia agentów. Klienci przyznali jednak, że przekształcenie tych możliwości w gotowych do produkcji agentów może być trudne, często wymagając rozległej iteracji podpowiedzi i niestandardowej logiki orkiestracji bez wystarczającej widoczności lub wbudowanego wsparcia.
Aby sprostać tym wyzwaniom, uruchamiamy nowy zestaw interfejsów API i narzędzi zaprojektowanych specjalnie w celu uproszczenia tworzenia aplikacji agentowych:
Nowy interfejs API Odpowiedzi (otwiera się w nowym oknie), łączący prostotę interfejsu API Zakończenia czatu z możliwościami wykorzystania narzędzi interfejsu API Asystentów do tworzenia agentów
Wbudowane narzędzia, w tym wyszukiwanie w sieci(otwiera się w nowym oknie), wyszukiwanie plików(otwiera się w nowym oknie) i korzystanie z komputera(otwiera się w nowym oknie)
Nowy zestaw Agents SDK(otwiera się w nowym oknie) do orkiestracji przepływów pracy dla pojedynczego agenta i wielu agentów
Zintegrowane narzędzia obserwowalności (otwiera się w nowym oknie) do śledzenia i sprawdzania wykonania przepływu pracy agenta
Te nowe narzędzia usprawniają podstawową logikę agenta, orkiestrację i interakcje, znacznie ułatwiając programistom rozpoczęcie tworzenia agentów. W nadchodzących tygodniach i miesiącach planujemy wydać dodatkowe narzędzia i możliwości, aby jeszcze bardziej uprościć i przyspieszyć tworzenie aplikacji agentowych na naszej platformie.
Przedstawiamy Responses API
Responses API to nasz nowy prymitywny interfejs API do wykorzystywania wbudowanych narzędzi OpenAI do tworzenia agentów. Łączy w sobie prostotę Chat Completions z możliwościami narzędziowymi API Assistants. Ponieważ możliwości modelu nadal ewoluują, wierzymy, że Responses API zapewni bardziej elastyczną podstawę dla programistów tworzących aplikacje agentowe. Dzięki pojedynczemu wywołaniu interfejsu API Respons, deweloperzy będą mogli rozwiązywać coraz bardziej złożone zadania przy użyciu wielu narzędzi i modeli.
Na początek, Responses API będzie obsługiwać nowe wbudowane narzędzia, takie jak wyszukiwanie w sieci, wyszukiwanie plików i korzystanie z komputera. Narzędzia te zostały zaprojektowane do współpracy w celu połączenia modeli ze światem rzeczywistym, dzięki czemu są bardziej przydatne w wykonywaniu zadań. Wprowadza również kilka ulepszeń użyteczności, w tym ujednolicony projekt oparty na elementach, prostszy polimorfizm, intuicyjne zdarzenia strumieniowe i pomocników SDK, takich jak response.output_text, aby łatwo uzyskać dostęp do danych wyjściowych modelu.
Interfejs API Responses jest przeznaczony dla programistów, którzy chcą łatwo łączyć modele OpenAI i wbudowane narzędzia w swoich aplikacjach, bez złożoności integracji wielu interfejsów API lub zewnętrznych dostawców. API ułatwia również przechowywanie danych w OpenAI, dzięki czemu programiści mogą oceniać wydajność agenta za pomocą funkcji takich jak śledzenie i oceny. Przypominamy, że domyślnie nie trenujemy naszych modeli na danych biznesowych, nawet jeśli dane są przechowywane w OpenAI. API jest dostępne dla wszystkich deweloperów od dziś i nie jest płatne osobno - tokeny i narzędzia są rozliczane według standardowych stawek określonych na naszej stronie cenowej (otwiera się w nowym oknie). Aby dowiedzieć się więcej, proszę zapoznać się ze skróconym przewodnikiem po interfejsie API Responses (otwiera się w nowym oknie).
Co to oznacza dla istniejących interfejsów API
Chat Completions API(otwiera się w nowym oknie): Chat Completions pozostaje naszym najbardziej rozpowszechnionym interfejsem API i jesteśmy w pełni zaangażowani we wspieranie go nowymi modelami i możliwościami. Programiści, którzy nie potrzebują wbudowanych narzędzi, mogą śmiało kontynuować korzystanie z Chat Completions. Będziemy nadal wydawać nowe modele do Chat Completions, gdy tylko ich możliwości nie będą zależeć od wbudowanych narzędzi lub wielu wywołań modeli. Jednak interfejs API Responses jest supersetem (otwiera się w nowym oknie) interfejsu Chat Completions o tej samej doskonałej wydajności, więc w przypadku nowych integracji zalecamy rozpoczęcie od interfejsu API Responses.
Assistants API(otwiera się w nowym oknie): Opierając się na opiniach deweloperów z wersji beta interfejsu API Assistants, wprowadziliśmy kluczowe ulepszenia do interfejsu API Responses, dzięki czemu jest on bardziej elastyczny, szybszy i łatwiejszy w użyciu. Pracujemy nad osiągnięciem pełnego parytetu funkcji między Assistants i Responses API, w tym obsługi obiektów podobnych do Assistant i Thread oraz narzędzia Code Interpreter. Po zakończeniu tych prac planujemy oficjalnie ogłosić wycofanie interfejsu API Assistants z docelową datą wygaśnięcia w połowie 2026 roku. Po wycofaniu, zapewnimy jasny przewodnik migracji z Assistants API do Responses API, który pozwoli deweloperom zachować wszystkie dane i przenieść swoje aplikacje. Dopóki formalnie nie ogłosimy wycofania, będziemy nadal dostarczać nowe modele do Assistants API. Responses API reprezentuje przyszły kierunek tworzenia agentów w OpenAI.
Wprowadzenie wbudowanych narzędzi w Responses API
Wyszukiwanie w sieci
Programiści mogą teraz uzyskać szybkie, aktualne odpowiedzi z jasnymi i odpowiednimi cytatami z sieci. W interfejsie API Responses wyszukiwanie w sieci jest dostępne jako narzędzie podczas korzystania z gpt-4o i gpt-4o-mini i może być sparowane z innymi narzędziami lub wywołaniami funkcji.
JavaScript
1
const response = await openai.responses.create({
2
model: "gpt-4o",
3
tools: { { type: "web_search_preview" } ],
4
input: "What was a positive news story that happened today?",
5
});
6
7
console.log(response.output_text);
Podczas wczesnych testów widzieliśmy deweloperów tworzących z wyszukiwarką internetową dla różnych przypadków użycia, w tym asystentów zakupów, agentów badawczych i agentów rezerwacji podróży - każdej aplikacji, która wymaga aktualnych informacji z sieci.
Na przykład, Hebbia(otwiera się w nowym oknie) wykorzystuje narzędzie wyszukiwania w sieci, aby pomóc zarządzającym aktywami, firmom private equity i kredytowym oraz kancelariom prawnym szybko uzyskać przydatne informacje z obszernych publicznych i prywatnych zbiorów danych. Integrując możliwości wyszukiwania w czasie rzeczywistym z ich przepływami pracy badawczej, Hebbia dostarcza bogatszych, kontekstowych informacji rynkowych i stale poprawia precyzję i trafność swoich analiz, przewyższając obecne benchmarki.
Wyszukiwanie internetowe w API jest oparte na tym samym modelu, co wyszukiwanie ChatGPT. W SimpleQA, benchmarku, który ocenia dokładność LLM w odpowiadaniu na krótkie, rzeczowe pytania, podgląd wyszukiwania GPT-4o i podgląd wyszukiwania GPT-4o mini uzyskują odpowiednio 90% i 88%.
Dokładność SimpleQA (wyższa oznacza lepszą)
63%
38%
47%
15%
90%
88%
0
20
40
60
80
100
Dokładność
GPT-4.5
GPT-4o
OpenAI o1
OpenAI o3-mini
GPT-4o
podgląd wyszukiwania
GPT-4o mini
podgląd wyszukiwania
Odpowiedzi generowane za pomocą wyszukiwania internetowego w API zawierają linki do źródeł, takich jak artykuły informacyjne i posty na blogach, dając użytkownikom możliwość dowiedzenia się więcej. Dzięki tym wyraźnym, wbudowanym cytatom użytkownicy mogą angażować się w informacje w nowy sposób, a właściciele treści zyskują nowe możliwości dotarcia do szerszego grona odbiorców.
Każda witryna lub wydawca może zdecydować się na wyświetlanie (otwiera się w nowym oknie) w wyszukiwarce internetowej w API.
Narzędzie wyszukiwania w sieci jest dostępne dla wszystkich deweloperów w wersji zapoznawczej w interfejsie API Odpowiedzi. Dajemy również deweloperom bezpośredni dostęp do naszych dopracowanych modeli wyszukiwania w interfejsie Chat Completions API za pośrednictwem gpt-4o-search-preview i gpt-4o-mini-search-preview. Ceny (otwiera się w nowym oknie) zaczynają się odpowiednio od 30 USD i 25 USD za tysiąc zapytań odpowiednio dla GPT-4o search i 4o-mini search. Proszę zapoznać się z wyszukiwaniem internetowym na Placu Zabaw (otwiera się w nowym oknie) i dowiedzieć się więcej w naszych dokumentach (otwiera się w nowym oknie).
Wyszukiwanie plików
Programiści mogą teraz łatwo pobierać istotne informacje z dużych ilości dokumentów za pomocą ulepszonego narzędzia wyszukiwania plików. Dzięki obsłudze wielu typów plików, optymalizacji zapytań, filtrowaniu metadanych i niestandardowemu ponownemu szeregowaniu, może ono dostarczać szybkie i dokładne wyniki wyszukiwania. I ponownie, dzięki interfejsowi API odpowiedzi, integracja zajmuje tylko kilka wierszy kodu.
JavaScript
1 const productDocs = await openai.vectorStores.create({
2 name: "Dokumentacja produktu",
3 file_ids: [file1.id, file2.id, file3.id],
4 });
5
6 const response = await openai.responses.create({
7 model: "gpt-4o-mini",
8 tools: [{
9 type: "file_search",
10 vector_store_ids: [productDocs.id],
11 }],
12 input: "Czym są głębokie badania OpenAI?",
13 });
14
15 console.log(response.output_text);
Narzędzie do wyszukiwania plików może być wykorzystywane w różnych rzeczywistych przypadkach użycia, w tym umożliwiając agentowi obsługi klienta łatwy dostęp do często zadawanych pytań, pomagając asystentowi prawnemu w szybkim odwoływaniu się do poprzednich spraw dla wykwalifikowanego specjalisty oraz pomagając agentowi kodowania w wyszukiwaniu dokumentacji technicznej. Na przykład Navan(otwiera się w nowym oknie) wykorzystuje wyszukiwanie plików w swoim opartym na sztucznej inteligencji biurze podróży, aby szybko zapewnić swoim użytkownikom precyzyjne odpowiedzi z artykułów bazy wiedzy (takich jak polityka podróży ich firmy). Dzięki wbudowanej optymalizacji zapytań i rerankingowi są oni w stanie skonfigurować potężny potok RAG (retrieval-augmented generation) bez dodatkowego dostrajania lub konfiguracji. Dzięki dedykowanym magazynom wektorów dla każdej grupy użytkowników, Navan jest w stanie dostosować odpowiedzi do indywidualnych ustawień konta i ról użytkowników, oszczędzając czas klientów i ich pracowników, jednocześnie pomagając w zapewnieniu dokładnego, spersonalizowanego wsparcia.
Narzędzie to jest dostępne w interfejsie API Odpowiedzi dla wszystkich deweloperów. Cena za użytkowanie (otwiera się w nowym oknie) wynosi 2,50 USD za tysiąc zapytań, a za przechowywanie plików 0,10 USD/GB/dzień, przy czym pierwszy GB jest bezpłatny. Narzędzie jest nadal dostępne w Assistants API. Wreszcie, dodaliśmy również nowy punkt końcowy wyszukiwania do obiektów API Vector Store, aby bezpośrednio wyszukiwać Państwa dane do wykorzystania w innych aplikacjach i interfejsach API. Proszę dowiedzieć się więcej w naszej dokumentacji (otwiera się w nowym oknie) i rozpocząć testowanie na Placu Zabaw (otwiera się w nowym oknie).
Korzystanie z komputera
Aby tworzyć agentów zdolnych do wykonywania zadań na komputerze, programiści mogą teraz korzystać z narzędzia do korzystania z komputera w interfejsie API Odpowiedzi, opartego na tym samym modelu agenta korzystającego z komputera (CUA), który umożliwia korzystanie z Operatora. Ten podglądowy model badawczy ustanowił nowy rekord state-of-the-art, osiągając 38,1% sukcesu w OSWorld (otwiera się w nowym oknie) dla zadań pełnego wykorzystania komputera, 58,1% w WebArena (otwiera się w nowym oknie) i 87% w WebVoyager (otwiera się w nowym oknie) dla interakcji internetowych.
Wbudowane narzędzie do korzystania z komputera przechwytuje działania myszy i klawiatury generowane przez model, umożliwiając programistom automatyzację zadań związanych z korzystaniem z komputera poprzez bezpośrednie tłumaczenie tych działań na wykonywalne polecenia w ich środowiskach.
JavaScript
1 const response = await openai.responses.create({
2 model: "computer-use-preview",
3 tools: [{
4 type: "computer_use_preview",
5 display_width: 1024,
6 display_height: 768,
7 environment: "browser",
8 }],
9 truncation: "auto",
10 input: "Szukam nowego aparatu. Proszę mi pomóc znaleźć najlepszy.",
11 });
12
13 console.log(response.output);
Programiści mogą korzystać z narzędzia do obsługi komputera, aby zautomatyzować przepływy pracy oparte na przeglądarce, takie jak zapewnianie jakości aplikacji internetowych lub wykonywanie zadań wprowadzania danych w starszych systemach. Przykładowo, Unify(otwiera się w nowym oknie) to system działania mający na celu zwiększenie przychodów, który wykorzystuje agentów do identyfikowania intencji, badania kont i angażowania kupujących. Korzystając z narzędzia komputerowego OpenAI, agenci Unify mogą uzyskać dostęp do informacji, które wcześniej były niedostępne za pośrednictwem interfejsów API - na przykład umożliwiając firmie zarządzającej nieruchomościami sprawdzenie za pomocą map online, czy firma rozszerzyła swój zasięg nieruchomości. Badanie to działa jako niestandardowy sygnał uruchamiający spersonalizowany zasięg - umożliwiając zespołom go-to-market angażowanie kupujących z precyzją i skalą.
Innym przykładem jest firma Luminai (otwiera się w nowym oknie), która zintegrowała narzędzie do korzystania z komputerów w celu zautomatyzowania złożonych operacyjnych przepływów pracy dla dużych przedsiębiorstw ze starszymi systemami, które nie mają dostępności API i znormalizowanych danych. W niedawnym programie pilotażowym z dużą organizacją społeczną Luminai zautomatyzowała przetwarzanie aplikacji i proces rejestracji użytkowników w ciągu zaledwie kilku dni - coś, co tradycyjna zrobotyzowana automatyzacja procesów (RPA) z trudem osiągnęła po miesiącach wysiłków.
Przed uruchomieniem CUA w Operatorze w zeszłym roku przeprowadziliśmy szeroko zakrojone testy bezpieczeństwa i red teaming, zajmując się trzema kluczowymi obszarami ryzyka: niewłaściwym użyciem, błędami modelu i ryzykiem granicznym. Aby zająć się ryzykiem związanym z rozszerzeniem możliwości Operatora na lokalne systemy operacyjne za pośrednictwem CUA w API, przeprowadziliśmy dodatkowe oceny bezpieczeństwa i red teaming. Dodaliśmy również środki łagodzące dla deweloperów, w tym kontrole bezpieczeństwa w celu ochrony przed szybkimi wstrzyknięciami, monity o potwierdzenie dla wrażliwych zadań, narzędzia pomagające deweloperom izolować ich środowiska oraz ulepszone wykrywanie potencjalnych naruszeń zasad. Chociaż te środki łagodzące pomagają zmniejszyć ryzyko, model nadal jest podatny na niezamierzone błędy, szczególnie w środowiskach innych niż przeglądarki. Na przykład wydajność CUA w OSWorld, benchmarku zaprojektowanym do pomiaru wydajności agentów AI w rzeczywistych zadaniach, wynosi obecnie 38,1%, co wskazuje, że model nie jest jeszcze wysoce niezawodny w automatyzacji zadań w systemach operacyjnych. W takich scenariuszach zalecany jest nadzór człowieka. Więcej szczegółów na temat naszych prac związanych z bezpieczeństwem API można znaleźć w naszej zaktualizowanej karcie systemu.
Typ testu porównawczego Test porównawczy Korzystanie z komputera (interfejs uniwersalny) Agenci przeglądania stron internetowych Człowiek
OpenAI CUA Poprzednia SOTA Poprzednia SOTA
Korzystanie z komputera OSWorld 38,1% 22,0% - 72,4%
Korzystanie z przeglądarki WebArena 58.1% 36.2% 57.1% 78.2%
WebVoyager 87,0% 56,0% 87,0% -
Szczegóły oceny są opisane tutaj
Od dziś narzędzie do korzystania z komputerów jest dostępne jako podgląd badawczy w interfejsie API Responses dla wybranych programistów na poziomach użytkowania 3-5 (otwiera się w nowym oknie). Cena użytkowania (otwiera się w nowym oknie) wynosi 3 USD/1 mln tokenów wejściowych i 12 USD/1 mln tokenów wyjściowych. Proszę dowiedzieć się więcej w naszej dokumentacji (otwiera się w nowym oknie) i sprawdzić przykładową aplikację (otwiera się w nowym oknie) ilustrującą sposób tworzenia za pomocą tego narzędzia.
Zestaw SDK dla agentów
Oprócz budowania podstawowej logiki agentów i zapewniania im dostępu do narzędzi, aby były użyteczne, programiści muszą również organizować agentowe przepływy pracy. Nasz nowy zestaw SDK Agents o otwartym kodzie źródłowym upraszcza orkiestrację przepływów pracy z wieloma agentami i oferuje znaczące ulepszenia w stosunku do Swarm (otwiera się w nowym oknie), eksperymentalnego zestawu SDK, który wydaliśmy w zeszłym roku i który został szeroko przyjęty przez społeczność programistów i pomyślnie wdrożony przez wielu klientów.
Ulepszenia obejmują:
Agentów: Łatwo konfigurowalne LLM z jasnymi instrukcjami i wbudowanymi narzędziami.
Przekazywanie: Inteligentne przekazywanie kontroli pomiędzy agentami.
Guardrails: Konfigurowalne kontrole bezpieczeństwa dla walidacji danych wejściowych i wyjściowych.
Śledzenie i obserwowalność: Wizualizacja śladów wykonania agenta w celu debugowania i optymalizacji wydajności.
Python
1 from agents import Agent, Runner, WebSearchTool, function_tool, guardrail
2
3 @function_tool
4 def submit_refund_request(item_id: str, reason: str):
5 # Państwa logika zwrotu idzie tutaj
6 return "success"
7
8 support_agent = Agent(
9 name="Support & Returns",
10 instructions="Jest Pan agentem pomocy technicznej, który może przesyłać zwroty [...]",
11 tools=[submit_refund_request],
12 )
13
14 shopping_agent = Agent(
15 name="Shopping Assistant",
16 instructions="Jest Pan asystentem zakupów, który potrafi przeszukiwać sieć [...]",
17 tools=[WebSearchTool()],
18 )
19
20 triage_agent = Agent(
21 name="Triage Agent",
22 instructions="Przekieruj użytkownika do właściwego agenta.",
23 handoffs=[shopping_agent, support_agent],
24 )
25
26 output = Runner.run_sync(
27 starting_agent=triage_agent,
28 input="Jakie buty najlepiej pasują do mojego dotychczasowego stroju?",
29 )
Agents SDK nadaje się do różnych rzeczywistych zastosowań, w tym automatyzacji obsługi klienta, wieloetapowych badań, generowania treści, przeglądu kodu i poszukiwania sprzedaży. Na przykład Coinbase (otwiera się w nowym oknie) wykorzystał Agents SDK do szybkiego prototypowania i wdrażania AgentKit, zestawu narzędzi umożliwiającego agentom AI płynną interakcję z portfelami kryptowalut i różnymi działaniami w łańcuchu. W ciągu zaledwie kilku godzin Coinbase zintegrowało niestandardowe działania ze swojej platformy deweloperskiej SDK w pełni funkcjonalnego agenta. Uproszczona architektura AgentKit uprościła proces dodawania nowych akcji agenta, pozwalając programistom skupić się bardziej na znaczących integracjach, a mniej na nawigacji po złożonych konfiguracjach agenta.
W ciągu kilku dni Box(otwiera się w nowym oknie) był w stanie szybko stworzyć agentów, którzy wykorzystują wyszukiwanie w sieci i Agents SDK, aby umożliwić przedsiębiorstwom wyszukiwanie, zadawanie zapytań i wydobywanie wniosków z nieustrukturyzowanych danych przechowywanych w Box i publicznych źródłach internetowych. Takie podejście umożliwia klientom nie tylko dostęp do najnowszych informacji, ale także przeszukiwanie ich wewnętrznych, zastrzeżonych danych w bezpieczny sposób, który jest zgodny z ich wewnętrznymi uprawnieniami i zasadami bezpieczeństwa. Na przykład firma świadcząca usługi finansowe może zbudować niestandardowego agenta, który wywołuje agenta Box AI w celu zintegrowania ich wewnętrznej analizy rynku przechowywanej w Box z wiadomościami w czasie rzeczywistym i danymi ekonomicznymi z sieci, zapewniając swoim analitykom kompleksowy wgląd w decyzje inwestycyjne.
Agents SDK współpracuje z interfejsami API Responses i Chat Completions. SDK będzie również współpracować z modelami innych dostawców, o ile zapewnią oni punkt końcowy API w stylu Chat Completions. Programiści mogą natychmiast zintegrować go ze swoimi bazami kodu Python, a wkrótce pojawi się wsparcie dla Node.js. Więcej informacji znajdą Państwo w naszej dokumentacji (otwiera się w nowym oknie).
Projektując Agents SDK, nasz zespół inspirował się doskonałą pracą innych członków społeczności, w tym Pydantic(otwiera się w nowym oknie), Griffe(otwiera się w nowym oknie) i MkDocs(otwiera się w nowym oknie). Jesteśmy zobowiązani do dalszego budowania Agents SDK jako frameworka open source, aby inni członkowie społeczności mogli rozwijać nasze podejście.
Co dalej: budowanie platformy dla agentów
Wierzymy, że agenci wkrótce staną się integralną częścią siły roboczej, znacznie zwiększając produktywność w różnych branżach. Ponieważ firmy coraz częściej starają się wykorzystywać sztuczną inteligencję do wykonywania złożonych zadań, jesteśmy zaangażowani w dostarczanie elementów składowych, które umożliwiają programistom i przedsiębiorstwom skuteczne tworzenie autonomicznych systemów, które wywierają rzeczywisty wpływ.
Wraz z dzisiejszymi wydaniami wprowadzamy pierwsze elementy składowe, które umożliwią deweloperom i przedsiębiorstwom łatwiejsze tworzenie, wdrażanie i skalowanie niezawodnych, wydajnych agentów AI. W miarę jak możliwości modeli stają się coraz bardziej agentowe, będziemy nadal inwestować w głębszą integrację naszych interfejsów API i nowe narzędzia, które pomogą wdrażać, oceniać i optymalizować agentów w produkcji. Naszym celem jest zapewnienie deweloperom płynnej platformy do tworzenia agentów, którzy mogą pomóc w różnych zadaniach w każdej branży. Z niecierpliwością czekamy na kolejne projekty deweloperów. Aby rozpocząć, proszę zapoznać się z naszą dokumentacją (otwiera się w nowym oknie) i być na bieżąco z kolejnymi aktualizacjami.