Google-მა ხმოვანი კარნახის ახალი AI აპლიკაცია გამოუშვა, რომელიც ინტერნეტის გარეშე მუშაობს
Google-მა წარადგინა Google AI Edge Eloquent — ხმოვანი კარნახის აპლიკაცია, რომელიც Gemma-ს მოდელებს იყენებს, ფილტრავს ზედმეტ სიტყვებს და მუშაობს ოფლაინ რეჟიმში.

Google-მა iOS პლატფორმისთვის ხმოვანი კარნახის ახალი აპლიკაცია, სახელწოდებით „Google AI Edge Eloquent“ გამოუშვა. აპლიკაცია, რომელიც Wispr Flow-ს, SuperWhisper-სა და Willow-ს კონკურენტად მოიაზრება, მომხმარებლებს ოფლაინ რეჟიმში მუშაობის შესაძლებლობას სთავაზობს.
აპლიკაცია უფასოა და Gemma-ზე დაფუძნებული ავტომატური მეტყველების ამოცნობის (ASR) მოდელების ჩამოტვირთვის შემდეგ, კარნახის ფუნქცია სრულად ხელმისაწვდომი ხდება. ტრანსკრიფციის პროცესი რეალურ დროში ჩანს, ხოლო პაუზის დროს სისტემა ავტომატურად ფილტრავს ზედმეტ სიტყვებს (მაგალითად, „ამმ“, „აჰ“) და ტექსტს უფრო დახვეწილ სახეს აძლევს.
ტრანსკრიფციის ქვემოთ მოცემულია სპეციალური ოფციები ტექსტის ტრანსფორმაციისთვის, როგორიცაა „Key points“ (მთავარი პუნქტები), „Formal“ (ოფიციალური), „Short“ (მოკლე) და „Long“ (ვრცელი).

მომხმარებლებს შეუძლიათ გამორთონ ღრუბლოვანი რეჟიმი (cloud mode) და გამოიყენონ მხოლოდ ლოკალური დამუშავება. როდესაც ღრუბლოვანი რეჟიმი ჩართულია, აპლიკაცია ტექსტის გასასუფთავებლად Gemini-ს მოდელებს იყენებს. სურვილის შემთხვევაში, Google AI Edge Eloquent-ს შეუძლია Gmail-იდან სპეციფიკური საკვანძო სიტყვების, სახელებისა და ჟარგონების იმპორტი. გარდა ამისა, შესაძლებელია საკუთარი სიტყვების დამატებაც.
ფუნქციონალი და სტატისტიკა
აპლიკაცია ინახავს ტრანსკრიფციების ისტორიას და იძლევა მათში ძებნის საშუალებას. მომხმარებელს შეუძლია ნახოს ბოლო სესიის დროს წარმოთქმული სიტყვები, წუთში წარმოთქმული სიტყვების რაოდენობა (WPM) და ჯამური მოცულობა.
„Google AI Edge Eloquent არის მოწინავე აპლიკაცია, რომელიც ბუნებრივ მეტყველებასა და პროფესიონალურ ტექსტს შორის არსებულ ნაპრალს ავსებს. სტანდარტული პროგრამებისგან განსხვავებით, რომლებიც შეცდომებსა და ზედმეტ სიტყვებს სიტყვასიტყვით წერენ, Eloquent იყენებს ხელოვნურ ინტელექტს სათქმელის არსის დასაფიქსირებლად. ის ავტომატურად შლის „ამმ“, „აჰ“ ტიპის ჩანართებსა და წინადადების შუაში გაკეთებულ თვითშესწორებებს, რის შედეგადაც სუფთა და ზუსტ პროზას ვიღებთ“, — ნათქვამია კომპანიის აღწერაში App Store-ზე.

ხელმისაწვდომობა და სამომავლო გეგმები
მიუხედავად იმისა, რომ აპლიკაცია ამჟამად მხოლოდ iOS-ზეა ხელმისაწვდომი, App Store-ის აღწერაში ნახსენებია Android ვერსიაც. აღწერის თანახმად, Eloquent შესთავაზებს „Android-თან შეუფერხებელ ინტეგრაციას“, სადაც ის შეიძლება დაყენდეს ნაგულისხმევ კლავიატურად ნებისმიერ ტექსტურ ველში გამოსაყენებლად. ასევე, აპლიკაციას ექნება „მცურავი ღილაკის“ (floating button) ფუნქცია, მსგავსად იმისა, რასაც Wispr Flow იყენებს Android-ზე.
ხელოვნურ ინტელექტზე დაფუძნებული ტრანსკრიფციის აპლიკაციები სულ უფრო პოპულარული ხდება მეტყველების ამოცნობის მოდელების გაუმჯობესებასთან ერთად. ამ ექსპერიმენტული აპლიკაციით Google უერთდება არსებულ ტრენდს. თუ ტესტირება წარმატებული აღმოჩნდება, შესაძლოა ტრანსკრიფციის გაუმჯობესებული ფუნქციები Android-ის სხვა სერვისებშიც ვიხილოთ.
მსგავსი სტატიები

ჯეფ ბეზოსის სტარტაპმა Prometheus-მა 12 მილიარდი დოლარი მოიზიდა „ხელოვნური ზოგადი ინჟინრის“ შესაქმნელად
ჯეფ ბეზოსის სტარტაპმა Prometheus-მა 12 მილიარდი დოლარი მოიზიდა. კომპანია მიზნად ისახავს „ხელოვნური ზოგადი ინჟინრის“ შექმნას, რომელიც ფიზიკური სისტემების წარმოების ავტომატიზაციას მოახდენს.

Theker-მა $85 მილიონი მოიზიდა უნივერსალური ქარხნის რობოტების შესაქმნელად, რომლებსაც ნებისმიერი დავალების შესრულება შეუძლიათ
ბარსელონაში დაფუძნებულმა სტარტაპმა Theker-მა $85 მილიონი მოიზიდა უნივერსალური, კონფიგურირებადი ქარხნის რობოტების შესაქმნელად, რაც ევროპისთვის რეკორდული მაჩვენებელია.

ინდური Avataar-ის ვიდეო AI: კულტურული კონტექსტი, სისწრაფე და რეკორდულად დაბალი ფასი
ინდურმა სტარტაპმა Avataar AI-მ წარადგინა ვიდეო მოდელი Varya, რომელიც ადგილობრივ კულტურას ითვალისწინებს, კონკურენტებზე 10-ჯერ სწრაფია და 20-ჯერ იაფი.