Vetenskap

Så fungerar Open AI:s nya o1-modeller – Revolutionerar AI-världen!

2024-09-16

Open AI har nyligen avslöjat sina nya o1-modeller som lovar att överträffa tidigare versioner i prestanda och kapabilitet. Enligt företaget presterar dessa modeller nästan som doktorander på utmanande uppgifter inom fysik, kemi och biologi, och briljerar speciellt inom matematik och kodning.

En riktigt imponerande prestation visar sig tydligt i ett kvalificeringsprov för den internationella matematikolympiaden där GPT-4o endast lyckades lösa 13 procent av problemen korrekt, medan den nya resonanta modellen klarade av hela 83 procent. Deras kodningsförmåga har även utvärderats i olika tävlingar, där de nådde upp till den 89:e percentilen i Codeforces-tävlingar, vilket visar på en enorm förbättring.

Open AI förväntar sig att den nya o1-modellen kommer att revolutionera fler områden, inklusive forskning, genom att exempelvis användas av vårdforskare för att analysera cellsekvenseringsdata, eller av fysiker för att generera komplicerade matematiska formler för kvantoptik.

Men vad är hemligheten bakom dessa nya modeller?

Den främsta faktorn bakom o1-modellernas förbättrade resonemangsförmåga är Open AI:s avancerade algoritm för förstärkt inlärning. Modellerna tillämpar en ”Chain of Thought”-mekanism som gör att de kan tänka mer produktivt under träningens gång. Det har visats att prestandan förbättras markant ju mer tid som modellerna får att analysera och lösa problem.

I kontrast med tidigare AI-modeller, där många parametrar fokuserades på att memorera fakta och prestera bra på trivia, bidrar o1-modellerna till en djupare och mer analytisk förståelse av problem som de ställs inför.

Nvidias seniora forskningschef Jim Fan berömmer denna utveckling och framhäver att det inte krävs en enorm modell för att utföra resonemang. Han uppmanar till mer forskning på inferens och hur man kan optimera arbetsflöden kring AI.

Men det finns fortfarande utmaningar!

Trots deras imponerande kapabiliteter, påpekar öppet AI att o1-modellen fortfarande befinner sig i ett tidigt utvecklingsstadium och saknar många funktioner som gör Chat GPT användbar, som webbsurfning och filhantering. Enligt företaget kommer den tidigare modellen GPT-4o att fortsätta vara mer kapabel för många vanliga användningsområden under en tid framöver.

Open AI har också tagit beslutet att dölja sina resonemangstoken, vilket innebär att användare inte har full insyn i hur modellerna resonerar. Detta väcker frågor inom utvecklargemenskapen, där kritiker uttrycker oro över att viktiga detaljer kan döljas vid användning av dessa kraftfulla verktyg.

Hur kan du få tillgång till dessa modeller?

Om du är en användare av Chat GPT Plus eller Team kommer du att kunna använda o1-modellerna redan från denna vecka. Både o1-preview och o1-mini kommer att göras tillgängliga för manuell val av användare. Open AI nämner även att företag bör förbereda sig på högre kostnader för prompt-användning på grund av de nya resonerande tokens.

Denna nya era av AI kommer onekligen att förändra såväl forskningsfält som kommersiella tillämpningar. Låt oss hålla ögonen öppna för fler spännande nyheter från Open AI!