Google-მა ხმოვანი კარნახის ახალი AI აპლიკაცია გამოუშვა, რომელიც ინტერნეტის გარეშე მუშაობს
Google-მა წარადგინა Google AI Edge Eloquent — ხმოვანი კარნახის აპლიკაცია, რომელიც Gemma-ს მოდელებს იყენებს, ფილტრავს ზედმეტ სიტყვებს და მუშაობს ოფლაინ რეჟიმში.

Google-მა iOS პლატფორმისთვის ხმოვანი კარნახის ახალი აპლიკაცია, სახელწოდებით „Google AI Edge Eloquent“ გამოუშვა. აპლიკაცია, რომელიც Wispr Flow-ს, SuperWhisper-სა და Willow-ს კონკურენტად მოიაზრება, მომხმარებლებს ოფლაინ რეჟიმში მუშაობის შესაძლებლობას სთავაზობს.
აპლიკაცია უფასოა და Gemma-ზე დაფუძნებული ავტომატური მეტყველების ამოცნობის (ASR) მოდელების ჩამოტვირთვის შემდეგ, კარნახის ფუნქცია სრულად ხელმისაწვდომი ხდება. ტრანსკრიფციის პროცესი რეალურ დროში ჩანს, ხოლო პაუზის დროს სისტემა ავტომატურად ფილტრავს ზედმეტ სიტყვებს (მაგალითად, „ამმ“, „აჰ“) და ტექსტს უფრო დახვეწილ სახეს აძლევს.
ტრანსკრიფციის ქვემოთ მოცემულია სპეციალური ოფციები ტექსტის ტრანსფორმაციისთვის, როგორიცაა „Key points“ (მთავარი პუნქტები), „Formal“ (ოფიციალური), „Short“ (მოკლე) და „Long“ (ვრცელი).

მომხმარებლებს შეუძლიათ გამორთონ ღრუბლოვანი რეჟიმი (cloud mode) და გამოიყენონ მხოლოდ ლოკალური დამუშავება. როდესაც ღრუბლოვანი რეჟიმი ჩართულია, აპლიკაცია ტექსტის გასასუფთავებლად Gemini-ს მოდელებს იყენებს. სურვილის შემთხვევაში, Google AI Edge Eloquent-ს შეუძლია Gmail-იდან სპეციფიკური საკვანძო სიტყვების, სახელებისა და ჟარგონების იმპორტი. გარდა ამისა, შესაძლებელია საკუთარი სიტყვების დამატებაც.
ფუნქციონალი და სტატისტიკა
აპლიკაცია ინახავს ტრანსკრიფციების ისტორიას და იძლევა მათში ძებნის საშუალებას. მომხმარებელს შეუძლია ნახოს ბოლო სესიის დროს წარმოთქმული სიტყვები, წუთში წარმოთქმული სიტყვების რაოდენობა (WPM) და ჯამური მოცულობა.
„Google AI Edge Eloquent არის მოწინავე აპლიკაცია, რომელიც ბუნებრივ მეტყველებასა და პროფესიონალურ ტექსტს შორის არსებულ ნაპრალს ავსებს. სტანდარტული პროგრამებისგან განსხვავებით, რომლებიც შეცდომებსა და ზედმეტ სიტყვებს სიტყვასიტყვით წერენ, Eloquent იყენებს ხელოვნურ ინტელექტს სათქმელის არსის დასაფიქსირებლად. ის ავტომატურად შლის „ამმ“, „აჰ“ ტიპის ჩანართებსა და წინადადების შუაში გაკეთებულ თვითშესწორებებს, რის შედეგადაც სუფთა და ზუსტ პროზას ვიღებთ“, — ნათქვამია კომპანიის აღწერაში App Store-ზე.

ხელმისაწვდომობა და სამომავლო გეგმები
მიუხედავად იმისა, რომ აპლიკაცია ამჟამად მხოლოდ iOS-ზეა ხელმისაწვდომი, App Store-ის აღწერაში ნახსენებია Android ვერსიაც. აღწერის თანახმად, Eloquent შესთავაზებს „Android-თან შეუფერხებელ ინტეგრაციას“, სადაც ის შეიძლება დაყენდეს ნაგულისხმევ კლავიატურად ნებისმიერ ტექსტურ ველში გამოსაყენებლად. ასევე, აპლიკაციას ექნება „მცურავი ღილაკის“ (floating button) ფუნქცია, მსგავსად იმისა, რასაც Wispr Flow იყენებს Android-ზე.
ხელოვნურ ინტელექტზე დაფუძნებული ტრანსკრიფციის აპლიკაციები სულ უფრო პოპულარული ხდება მეტყველების ამოცნობის მოდელების გაუმჯობესებასთან ერთად. ამ ექსპერიმენტული აპლიკაციით Google უერთდება არსებულ ტრენდს. თუ ტესტირება წარმატებული აღმოჩნდება, შესაძლოა ტრანსკრიფციის გაუმჯობესებული ფუნქციები Android-ის სხვა სერვისებშიც ვიხილოთ.
მსგავსი სტატიები

OpenAI-ის ხედვა ხელოვნური ინტელექტის ეკონომიკაზე: საზოგადოებრივი ფონდები, რობოტების გადასახადი და 4-დღიანი სამუშაო კვირა
OpenAI-მ წარადგინა პოლიტიკის გეგმა, რომელიც AI-ს ეპოქაში სიმდიდრის განაწილებას, რობოტების დაბეგვრასა და 4-დღიან სამუშაო კვირას ითვალისწინებს.

ირანი „Stargate“-ის ხელოვნური ინტელექტის მონაცემთა ცენტრებს დარტყმით ემუქრება
ირანი ამერიკულ ტექნოლოგიურ ინფრასტრუქტურას, მათ შორის OpenAI-სა და Oracle-ის 500-მილიარდიან „Stargate“ პროექტს, სარაკეტო დარტყმებით ემუქრება.

იაპონიაში რობოტები სამუშაო ადგილებს კი არ ართმევენ ადამიანებს, არამედ იმ ვაკანსიებს ავსებენ, რომლებზეც მუშაობა არავის სურს
იაპონია ფიზიკური ხელოვნური ინტელექტის სექტორში ლიდერობას ცდილობს, რათა მწვავე დემოგრაფიული კრიზისი და მუშახელის დეფიციტი დაძლიოს.