Microsoft przyspiesza dostrajanie GPT-4.1 dzięki Direct Preference Optimization w Azure AI

3 Minuty

Microsoft przyspiesza dostrajanie GPT-4.1 dzięki bezpośredniej optymalizacji preferencji

Microsoft na nowo definiuje sposób, w jaki firmy dostosowują duże modele językowe, wprowadzając aktualizacje do platformy Azure AI. Najnowsze ulepszenia w portalu Azure AI Foundry oraz w udoskonalonych API i SDK w usłudze Azure OpenAI umożliwiają wykorzystanie Direct Preference Optimization (DPO) zarówno dla GPT-4.1, jak i lżejszej wersji GPT-4.1-mini.

Czym jest Direct Preference Optimization i dlaczego to istotne?

DPO to zaawansowana technika tuningu modeli sztucznej inteligencji, pozwalająca deweloperom na jeszcze lepsze dostosowanie działania AI do oczekiwań użytkowników poprzez analizę ich preferencji. W przeciwieństwie do klasycznego Reinforcement Learning z informacją zwrotną od ludzi (RLHF), DPO polega na porównywaniu preferowanych i odrzuconych odpowiedzi, dzięki czemu wagi modelu są precyzyjniej dostosowywane do wymagań użytkowników i charakteru marki. DPO jest znacznie mniej zasobochłonny niż RLHF, a jednocześnie zapewnia zbliżoną precyzję dopasowania modelu.

Innowacyjne podejście DPO pozwala firmom szybciej tworzyć modele AI idealnie dopasowane do specyficznego stylu komunikacji, wymogów bezpieczeństwa i wytycznych brandingowych – jednocześnie redukując czas uczenia maszynowego i koszty.

Rozszerzenie treningu globalnego Azure AI na kolejne regiony

Microsoft rozszerza też funkcjonalność Global Training w Azure AI na 12 nowych regionów, w tym East US, West Europe, UK South i Switzerland North. Pomimo szerszej dostępności, ta funkcja pozostaje na razie w publicznej wersji testowej. Poszerzenie geograficzne Azure AI jest szczególnie ważne w kontekście rosnącego znaczenia suwerenności danych – zwłaszcza w Europie, gdzie przepisy wymagają lokalnego przechowywania i przetwarzania informacji dla lepszej ochrony prywatności i zgodności z regulacjami.

Nowe funkcje i możliwości w Azure AI

Nadchodzące aktualizacje platformy wprowadzą funkcje takie jak możliwość wstrzymania i wznowienia procesu dostrajania oraz ciągłe udoskonalanie modeli AI. Microsoft planuje również udostępnić wersję GPT-4.1-nano w nowych wspieranych regionach, dając deweloperom oraz firmom jeszcze większą elastyczność i efektywność.

Premiera Responses API: inteligentniejsze integracje AI

Deweloperzy mogą już korzystać z nowego interfejsu Responses API, który umożliwia bezproblemową integrację dostosowanych modeli AI z szeroką gamą aplikacji i procesów biznesowych. API to doskonale wspiera złożoną, wieloetapową konwersację z AI, pozwala na obsługę rozbudowanego kontekstu rozmowy oraz łatwą integrację narzędzi – wszystko to działa przejrzyście w tle.

Responses API rejestruje historię rozmowy, pokazuje proces rozumowania modelu, prezentuje status generowania odpowiedzi w czasie rzeczywistym oraz umożliwia jednoczesną obsługę wielu zapytań. Jest w pełni kompatybilny z różnorodnymi narzędziami AI, od wyszukiwarek internetowych po systemy wyszukiwania dokumentów.

Wpływ na rynek i zastosowania biznesowe

Dzięki tym innowacjom Microsoft wzmacnia pozycję Azure AI jako elastycznej i globalnej platformy do skalowalnego oraz bezpiecznego rozwoju AI. Nowy tuning oparty na DPO, rozszerzenie zasięgu regionalnego oraz przyjazne dla deweloperów API sprawiają, że firmy z różnych branż mogą tworzyć rozwiązania AI, które są nie tylko wysoce spersonalizowane, ale również zgodne z najnowszymi regulacjami dotyczącymi danych.

Dla organizacji chcących wdrożyć konwersacyjne AI w obsłudze klienta, tworzeniu treści czy interakcjach z marką, nowe narzędzia Azure AI wyznaczają nowy standard efektywności, elastyczności i ochrony prywatności.

Źródło: neowin

Anna Zielińska

Cześć! Mam na imię Anna i codziennie przeglądam świat technologii, aby dostarczyć Ci najnowsze i najbardziej wiarygodne informacje – wszystko w prostym języku.

Komentarze

Zostaw komentarz

Microsoft przyspiesza dostrajanie GPT-4.1 dzięki Direct Preference Optimization w Azure AI

Microsoft przyspiesza dostrajanie GPT-4.1 dzięki bezpośredniej optymalizacji preferencji

Czym jest Direct Preference Optimization i dlaczego to istotne?

Rozszerzenie treningu globalnego Azure AI na kolejne regiony

Nowe funkcje i możliwości w Azure AI

Premiera Responses API: inteligentniejsze integracje AI

Wpływ na rynek i zastosowania biznesowe

Komentarze

Powiązane posty

Beeper – Nowa Jakość Bezpiecznej Komunikacji Wieloplatformowej

Nowy krok w technologii składanych smartfonów: Galaxy Z TriFold pojawia się na horyzoncie

Powrót Bugdroida: Kultowy Androidowy Maskotka Ponownie w Sprzedaży

8BitDo Pro 3: Nowy standard wśród kontrolerów do retro gier

Samsung Galaxy Z Fold7: Lżejszy, cieńszy, ale bez wsparcia dla S Pen. Co dalej?

Hisense 100-calowy Smart TV U7 Series ULED 4K Google – kinowy ekran w promocyjnej cenie

ASUS prezentuje wydajny mini komputer NUC 15 Pro

Scale AI dokonuje redukcji zatrudnienia i zmienia strategię wobec zmian na rynku sztucznej inteligencji

Ogromne inwestycje USA w ofensywne operacje cybernetyczne

Apple Watch Air – Czy Nadchodzi Nowa Era Inteligentnych Zegarków?