A Microsoft újabb szintre emeli az operációs rendszerbe ágyazott mesterséges intelligenciát: a Windows 11 Insider verziókban debütáló Copilot Vision mostantól képes látni az egész képernyőnket, nem csupán két alkalmazás ablakát, ha úgy döntünk, hogy megosztjuk vele a képernyőnket. Ez a vizuális megfigyelés lehetővé teszi, hogy a Copilot tartalmakat értelmezzen, tippeket adjon, kérdésekre válaszoljon - és mindezt szóban, valós időben.
A dolog nem teljesen új, tavaly már kísérletezett hasonlóval a Microsoft a nemrég fürgébbé vált Edge böngészőben, sőt mobilon is, de most vált igazán rendszerszintűvé. A redmondiak szerint az újítás nemcsak kreatív projekteknél vagy játék közben lehet hasznos, de például egy önéletrajz finomhangolásában is segíthet.
És ha már szóba került a hasznosság: a friss Describe image opció végre tényleg egy olyan funkció, amire azt lehet mondani, hogy értelme van. Az új Click to Do menüpont képes bármilyen képről szöveges leírást készíteni, teljesen helyben, a gépeden futó MI-modellel, adatküldés nélkül. Ez nemcsak gyengénlátók számára lehet hasznos, hanem mindenkinek, aki képekhez alternatív szövegeket ír, dokumentumokat vagy cikkeket készít.
Persze van egy kis csavar a történetben: a leíró funkció egyelőre kizárólag a Snapdragon-alapú Copilot+ PC-ken működik, az AMD és Intel gépekre később érkezik. Vagyis ahhoz, hogy mindenki számára elérhető legyen, még kell egy kis idő.