Artikel-Archiv c't KI-Praxis, Seite 34

  • Thumbnail, c't KI-Praxis, Seite 34

    Wie Benchmarks Sprach-KIs vermessen

    „90 Prozent Genauigkeit“, „besser als der Mensch“: So huldigen Entwickler, Firmen und Medien gerne den Fähigkeiten neuer Sprachmodelle. In freier Wildbahn folgt meist die große Ernüchterung, denn fast jeder Chatbot versteigt sich zu hanebüchenen Aussagen und halluziniert munter vor sich hin. Bleibt die Frage: Was genau und womit haben die bloß gemessen?

    Umfang: ca. 5.66 redaktionelle Seiten
    BibTeX anzeigen