AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Programmieren allgemein AI: Gemini Bildgenerierung via html/javascript
Thema durchsuchen
Ansicht
Themen-Optionen

AI: Gemini Bildgenerierung via html/javascript

Ein Thema von erich.wanker · begonnen am 16. Dez 2024 · letzter Beitrag vom 17. Dez 2024
Antwort Antwort
Benutzerbild von erich.wanker
erich.wanker

Registriert seit: 31. Jan 2008
Ort: im schönen Salzburger Land
461 Beiträge
 
Delphi XE4 Professional
 
#1

AI: Gemini Bildgenerierung via html/javascript

  Alt 16. Dez 2024, 20:03
Hallo, ich wollte grad ein bisserl rumspielen - schaff es aber nicht ein AI Bild mit "gemini-1.5-flash" zu erstellen..

der Browser meldet 2 Fehler:
Failed to load resource: the server responded with a status of 404 ()Understand this errorAI
Fehler bei der API-Anfrage:



Die HTML-Seite schaut wie folgt aus:

Code:
<!DOCTYPE html>
<html lang="de">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Bildgenerator-Spielerei</title>
    <style>
        body {
            font-family: Arial, sans-serif;
            margin: 20px;
        }
        #image {
            margin-top: 20px;
            max-width: 100%;
        }
    </style>
</head>
<body>

    <button onclick="generateImage()">Generieren</button>
    <img id="image" src="" alt="Generiertes Bild">

    <script>

        async function generateImage() {
            const apiKey = 'xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx';
            try {
                const response = await fetch(`https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash?key=xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx`, {
                    mode: 'no-cors', method: 'POST',
                    headers: {
                        'Content-Type': 'application/json',
                        'Authorization': `Bearer ${apiKey}`,
                        'key' : 'xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'
                       
                    },
                    body: JSON.stringify({
                        prompt: "Testbild mit einer Sonneblume",
                        model: 'gemini-1.5-flash',
                        aspect_ratio: '16:9',
                        style: 'photorealistic'
                    }),
                });

                if (response.ok) {
                    const result = await response.json();
                    document.getElementById('image').src = result.image_url;
                } else {
                    console.error('Fehler bei der API-Anfrage:', response.statusText);
                }
            } catch (error) {
                console.error('Fehler bei der Bilderzeugung:', error);
            }
        }
    </script>
</body>
</html>

Mein Api-Schlüssel funktioniert.. wenn ich "händisch" im Browser die Adresse eingebe:
https://generativelanguage.googleapi...1.5-flash?key= xxxxxxxxxxxxxxxxxxxxxxx
bekomme ich:
Code:
{
  "name": "models/gemini-1.5-flash",
  "version": "001",
  "displayName": "Gemini 1.5 Flash",
  "description": "Alias that points to the most recent stable version of Gemini 1.5 Flash, our fast and versatile multimodal model for scaling across diverse tasks.",
  "inputTokenLimit": 1000000,
  "outputTokenLimit": 8192,
  "supportedGenerationMethods": [
    "generateContent",
    "countTokens"
  ],
  "temperature": 1,
  "topP": 0.95,
  "topK": 40,
  "maxTemperature": 2
}

Hat wer eine Idee woran es liegen könnte?

LiGrü
Erich
Erich Wanker - for life:=1971 to lebensende do begin ..
O
/H\
/ \
  Mit Zitat antworten Zitat
Benutzerbild von Bernhard Geyer
Bernhard Geyer

Registriert seit: 13. Aug 2002
17.201 Beiträge
 
Delphi 10.4 Sydney
 
#2

AW: AI: Gemini Bildgenerierung via html/javascript

  Alt 17. Dez 2024, 08:09
Nutzt du hier TWebbrowser.
Immer mehr Webseiten werden nicht mehr mit diesen abgekündigten Browser laufen.
Windows Vista - Eine neue Erfahrung in Fehlern.
  Mit Zitat antworten Zitat
Benutzerbild von Sinspin
Sinspin

Registriert seit: 15. Sep 2008
Ort: Dubai
691 Beiträge
 
Delphi 10.3 Rio
 
#3

AW: AI: Gemini Bildgenerierung via html/javascript

  Alt 17. Dez 2024, 08:41
Verstehe ich das richtig dass du die Seite "Bildgenerator-Spielerei" bei dir lokal im Browser ausführst? So dass der Browser dann das generierte Bild nachlädt?
Wäre es nicht besser auf das ganze drumrum zu verzichten und den post via REST selber zu machen?
Die Bilder kommen meißt als B64 embedded zurück, das macht keinen Spass das selber aufzudrusseln, soweit kann ich verstehen dass du einen Browser bemühst.
Was passiert wenn du FF oder so mit den Script aufrufst?
Stefan
Nur die Besten sterben jung
A constant is a constant until it change.
  Mit Zitat antworten Zitat
Benutzerbild von Phoenix
Phoenix
(Moderator)

Registriert seit: 25. Jun 2002
Ort: Hausach
7.641 Beiträge
 
#4

AW: AI: Gemini Bildgenerierung via html/javascript

  Alt 17. Dez 2024, 10:00
Also Gemini 1.5 flash kann laut Google docs nur text generieren (https://ai.google.dev/gemini-api/docs/models/gemini).

Dort steht:
Input(s): Audio, images, videos and text
Output: Text

Bei Gemini 2.0 Flash steht:
Inputs(s): Audio, images, videos and text
Output: Text, images (coming soon), and audio (coming soon)

Aber grundsätzlich, auch um text zu generieren:

Nehm erstmal den `Authorization` und den `key`-Header raus. Gemini will den Key wohl als Query-Parameter, und den dann nochmal mehrfach in den Headern mitschicken hilft nicht.

Zweitens sieht der Body falsch aus.
Das sollte in etwa so aussehen:

Code:
{
  "contents": [{
    "parts": [{"text": "Write a story about a magic unicorn."}]
  }]
}
Da sollte nix mit Model, aspect ratio etc. drin stehen.

Schau Dir am besten mal die Gemini API Dokumentation im Detail an.
Sebastian Gingter
Phoenix - 不死鳥, Microsoft MVP, Rettungshundeführer
Über mich: Sebastian Gingter @ Thinktecture Mein Blog: https://gingter.org
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 10:58 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz