Tabnine führt Funktion zur Kennzeichnung unlizenzierten Codes in
KI-generierter Software ein
Neues Feature schützt Entwicklungsteams vor Urheberrechtsverletzungen bei der
Arbeit mit beliebten KI-Sprachmodellen (LLM)
TEL AVIV, Israel, Dec. 17, 2024 (GLOBE NEWSWIRE) -- Tabnine , Begründer der
Kategorie KI-Code-Assistenten, hat heute Code Provenance and Attribution
(Codeherkunft und -zuordnung) vorgestellt. Diese Funktion ermöglicht es
Unternehmen, von der Nutzung umfangreicher und beliebter großer Sprachmodelle
(Large Language Models (LLMs) für Softwareentwicklungsaufgaben zu profitieren
und gleichzeitig das Risiko zu minimieren, dass Code mit restriktiver Lizenz in
ihre Codebasis eingeschleust wird.
Die großen Sprachmodelle von Anthropic, OpenAI u.a. werden mit umfangreichen
Katalogen von Inhalten und Code trainiert. Diese Inhalte stammen aus öffentlich
sichtbaren Quellen, von denen viele nicht frei lizenziert sind. In Kombination
mit der Tendenz von LLMs, Inhalte zu generieren, die dem bereits Gesehenen
ähneln, kann die Verwendung der Modelle dieser Anbieter zu Risiken im
Zusammenhang mit geistigem Eigentum oder Urheberrechtsverpflichtungen führen.
Mit Provenance and Attribution vergleicht Tabnine den Code, der mithilfe von
KI-Chat oder KI-Agenten generiert wurde, mit öffentlich sichtbarem Code auf
GitHub. Tabnine markiert Übereinstimmungen und verweist auf das
Quell-Repository sowie dessen Lizenztyp. Diese Informationen erleichtern es
Entwicklungsteams, KI-generierten Code zu überprüfen und zu entscheiden, ob die
Lizenz des Codes ihren spezifischen Standards und Anforderungen entspricht.
Mit der neuen Funktion Provenance and Attribution wird Tabnine
Entwicklungsteams sowie Rechts- und Compliance-Teams leichter unterstützen
können, wenn sie eine Vielzahl leistungsstarker Modelle nutzen möchten.
„Modelle, die mit größeren Datensätzen trainiert wurden, die wiederum nicht
aus Open-Source-Code mit großzügigeren Lizenzen stammen, können eine bessere
Leistung bieten. Unternehmen, die diese Modelle nutzen, laufen jedoch Gefahr,
Rechte in Bezug auf geistiges Eigentum und Urheberrechte zu verletzen“, erklärt
Peter Guagenti, President bei Tabnine. „Unsere Funktion hinsichtlich
Codeherkunft und -zuordnung löst dieses Problem, indem sie die Produktivität
steigert, ohne die Compliance zu gefährden. Erfahrene Engineering-Teams
erwarten, dass sie die Quelle und die Lizenz des generativen KI-Ergebnisses
kennen. Diese Funktion stellt nun sicher, dass sie dies auch tun“.
Da die Urheberrechte für die Nutzung von KI-generierten Inhalten noch
ungeklärt sind, zielt Tabnine mit seinem proaktiven Ansatz darauf ab, das
Risiko der Verletzung von Rechten des geistigen Eigentums bei der Nutzung von
Unternehmensmodellen – wie beispielweise Claude von Anthropic, GPT-4o von
OpenAI's und Command R+ von Cohere – für die Softwareentwicklung drastisch zu
reduzieren.
Das lizenzkonforme Modell von Tabnine, Tabnine Protected 2, das ausschließlich
auf Code trainiert wird, der unter einer freieren Lizenz steht, bleibt ein
wichtiges und unverzichtbares Angebot von Tabnine. Viele Unternehmen sind der
Ansicht, dass allein die Verwendung eines LLM, das auf nicht lizenzierter
Software trainiert wurde, ein Risiko darstellen könnte. Aus diesem Grund wird
Tabnine dieses einzigartige Modell weiterhin unterstützen und weiterentwickeln.
Die neue Funktion Provenance and Attribution bietet Unterstützung für Rechts-
und Compliance-Teams, die mit einer größeren Vielfalt von Modellen vertraut
sind, solange sie nicht explizit unlizenzierten Code einfügen.
Die Funktion „Code Provenance and Attribution“ unterstützt das gesamte
Spektrum der Softwareentwicklung in Tabnine, einschließlich Codegenerierung,
Fehlerbehebung im Code, Generierung von Testfällen, Implementierung von
Jira-Problemen und vieles mehr. Da Tabnine den Code wie ein Mensch liest,
erkennt und markiert Tabnine nicht nur Ergebnisse, die exakt mit
Open-Source-Code auf GitHub übereinstimmen, sondern auch, wenn es sich um
funktionale Übereinstimmungen oder um Übereinstimmung hinsichtlich der
Implementierung handelt.
Tabnine plant in naher Zukunft eine Funktion hinzuzufügen, die es Nutzern
ermöglicht, bestimmte Repositories zu identifizieren, z.B. solche, die von
Wettbewerbern verwaltet werden. Tabnine wird dann auch den generierten Code mit
diesen Repositories abgleichen. Darüber hinaus plant Tabnine, eine
Zensurfunktion hinzuzufügen, die es den Administratoren von Tabnine ermöglicht,
den betroffenen Code zu entfernen, bevor dieser dem Entwickler angezeigt wird.
Code Provenance and Attribution befindet sich in Private Preview, ist für alle
Tabnine-Kunden zugänglich und funktioniert mit allen verfügbaren Modellen,
einschließlich Anthropic, OpenAI, Cohere, Llama, Mistral und Tabnine. Weitere
Informationen zu Code Provenance and Attribution finden Sie hier .
Über Tabnine
Tabnine unterstützt Entwicklungsteams jeder Größe dabei, künstliche
Intelligenz (KI) zu nutzen, um den Softwareentwicklungszyklus zu beschleunigen
und zu verbessern. Als erster KI-Code-Assistent wurde Tabnine bereits von
Millionen von Entwicklern weltweit eingesetzt, um die Codequalität und die
Zufriedenheit der Entwickler mithilfe generativer KI zu verbessern. Im
Gegensatz zu anderen Programmierassistenten haben Sie bei Tabnine die Kontrolle
über die KI. Diese ist umfassend auf Ihr Entwicklungsteam zugeschnitten, privat
und sicher (sie läuft problemlos in Ihren kontrollierten Umgebungen), speichert
oder trainiert niemals den Code Ihres Unternehmens oder Benutzerdaten und
bietet Modelle, die ausschließlich auf Open-Source-Code mit offenen Lizenzen
trainiert wurden, um Risiken im Zusammenhang mit geistigem Eigentum
auszuschließen. Weitere Informationen finden Sie auf unserer Website unter
tabnine.com . Gerne können Sie uns auch auf LinkedIn folgen.
Contact
press@tabnine.com