Dostępność obrazu dzięki sztucznej inteligencji: OCR, opis sceny i przepływ pracy na komputerze stacjonarnym
Dostępność wizyjna to nie tylko czytniki ekranu. Wiele codziennych blokad ma charakter bardziej szczegółowy: zrzut ekranu z tekstem, trudny do odczytania plik PDF, mała etykieta interfejsu użytkownika, zdjęcie z ważnym kontekstem lub formularz wymagający uproszczenia.
Sztuczna inteligencja może pomóc, jeśli zostanie zaprojektowana jako ukierunkowane narzędzie przepływu pracy, a nie ogólny asystent.
Przydatne wskazówki
- OCR dla zrzutów ekranu i dokumentów.
- Przeczytaj na głos z uproszczonymi wyjaśnieniami.
- Opis obrazu dla kontekstu praktycznego.
- Powiększenie ze wskazówkami semantycznymi.
- Wyjaśnienie formularza i wskazówki krok po kroku.
Prywatność ma znaczenie, ponieważ kontekst wizualny może obejmować dokumenty osobiste, adresy, informacje zdrowotne lub ekrany prywatne. Jeśli to możliwe, należy rozważyć przetwarzanie w pierwszej kolejności lokalne.
Jest to jeden z kierunków, w których IliciLabs może wyjść poza Aurora: małe narzędzia komputerowe, które pomagają ludziom szybciej i bardziej niezależnie rozumieć treś��.