Yapay Konuşma Sistemleri

Çağrı Doğan

Yapay konuşma sistemi iki grupta incelenebilir:

Konuşma işlevini gören Sentezleyici ve sentezleyiciye ne söyleyeceğini aktaran ekran okuyucu.

Kişisel bilgisayarlarla kullanılan sentezleyiciler metni konuşmaya dönüştürücü (text-to-speech) sistemlerdir. Bu sistemler bir dilin bütün sesbirimlerini ve dilbilgisi kurallarını kapsayacak şekilde programlanırlar. Bu, sentezleyicilerin sözcükleri doğru telaffuz etmesine olanak tanır. Bazı özel ad ve bileşik sözcükler sıra dışı harf kombinasyonlarından oluştukları için problem yaratabilirler.

Sentezleyici, bilgisayar içine yerleştirilen bir kart, bir kablo aracılığıyla bilgisayara bağlanan bir kutu ya da bilgisayar üzerinde kurulu ses kartıyla birlikte çalışan bir yazılım olabilir. Sentetik konuşma, sentezleyiciye bağlı olarak, mekanik ya da insan sesine yakın bir kalitede olabilir. Fiyatları 150USD ile 1300USD arasında değişmektedir.

Konuşma programı bilgisayar hafızasına yüklenir. Komutlar sentezleyiciye: (a) Farklı klavye tuş kombinasyonlarına basarak; (b) Ayrı bir klavyedeki tuşlar kullanılarak; (c) Bilgisayar ekranında değişme meydana geldiğinde otomatik olarak aktarılabilir.

Bu komutlar sentezleyiciye bir sözcük, satır ya da ekrandaki bilginin tamamını okuması için talimat gönderir. Farklı tuş kombinasyonları, sözcüğü kodla, ekranda bu metni bul, PC imlecinin konumunu bildir vb. Komutlar gönderir. Bunların yanı sıra, belli bir renkle yazılmış metinleri yerleştirme; istenildiğinde, ekranda önceden tasarlanmış bölgeleri okuma; ya da kullanıcının, ekrandaki menüde aktif olan seçeneğin ne olduğunu öğrenmesini sağlayan, seçilmiş metni okuma gibi daha gelişmiş işlemler gerçekleştirebilirler. Aynı zamanda, kullanıcının, bir kelime işlemci içindeki imla kılavuzunu kullanmasını ve bir spreadsheet içindeki hücreleri okumasını sağlarlar.

Dos, Windows95 / 98 / ME / 2000 / NT, OS2, Linux işletim sistemleri üzerinde çalışabilen ekran okuma programları mevcuttur. Her biri farklı bir komut yapılarından oluşur ve birçoğunun çeşitli konuşma sentezleyicileri için desteği bulunmaktadır. Fiyatları 400USD ile 1500USD arasında değişmektedir.

 

Windows Tabanlı Ekran Okuyucular Nasıl Çalışır?

 

Windows işletim sisteminin grafiksel ve görsel yapısı, bir ekran okuyucunun ekranda görüneni alıp sentezleyiciye göndermekten daha fazlasını yapmasını gerektirir. Ekran okuyucunun görevleri beş katagoride incelenebilir:

 Metin ekranda görüntülendiğinde, Windows bu metni küçük noktalardan oluşan matrixler olarak tutar. Bir ekran okuyucunun bu bilgiye yorumlaması ya da neyin metin, neyin resim olduğunu anlaması mümkün değildir. Windows tabanlı ekran okuyucu, Windows uygulamaları tarafından ekrana gönderilen bilgiyi alır ve off-screen model (osm) adı verilen bellek yapısında tutar. Ekran okuyucu okuma işlemini, ekrandaki grafiksel görüntü yerine OSM’den yapar

Windows, uygulamalara ait öğelerin tipini (type) veya sınıfını (class) sunar ve bir çok ekran okuyucu bu bilgiyi alıp kullanıcıya aktarma kapasitesine sahiptir. Tipik bir Windows diyalog kutusunda, bir görevin devamı için basılması gereken bir buton bulunabilir. Windows ekran okuyucusu, yalnızca ekrandaki texti baştan sona okumak yerine, üzerinde bulunulan öğelerin bir buton, radyo buton, liste öğesi vb. Olup olmadıklarını ayırt eder ve bu yönde kullanıcıyı bilgilendirir.

Bir çok Windows özelliği ekranda icon ya da grafik olarak görüntülenir. Ekran okuyucu program bu icon ya da grafikleri, kullanıcıya anlamlı bir şekilde aktarmak için, tanımlar. Örneğin, bir çöp sepeti “sil” diye tanımlanabilir.

Windows uygulamalarının bazı özellikleri yalnızca fare ile ulaşılabilen ve fare butonlarının tıklanmasıyla aktive edilen özelliklerdir. Fare imlecinin, ekranın belli bir bölgesinde konumlandırılmasındaki zorluğun aşılması için, Windows tabanlı ekran okuyucular bu işlemlerin klavye aracılığıyla yapılmasını sağlayacak şekilde programlanmışlardır.

Ekran okuyucu, kullanıcının bilgiye verimli bir şekilde erişimi için alternatif bir ara yüz sağlamalıdır. Ekrandaki bilginin baştan sona okunması, kör kullanıcı için yeterli olmayacaktır. Bu bağlamda, Bilginin , kullanıcıya zaman, konum ve tip açısından doğru aktarılması önemli bir koşuldur. Örneğin, konuşma programı bir iletişim kutusunu okurken, hangi seçeneğin aktif seçenek olduğunu kullanıcıya bildirmek zorundadır.

Microsoft aktif erişilebilirlik (MSAA) programcıların takip edeceği bir programlama dili standartları serisidir. Kullanıcının bu standarttan faydalanabilmesi için, Windows uygulaması ve ekran okuyucu programın bu standarda göre programlanmış olması gerekir. Internet Explorer 5.0, Office 2000 ve Lotus Notes bu standarda göre programlanmıştır.

Ekran okuma programı değerlendirirken ve satın alırken dikkat edilmesi gereken hususlar

 

Bir ekran okuyucuyu satın almadan önceki test ve inceleme aşamasında. bazı temel sorulara yanıt aranmalıdır:

Hangi işletim sistemi kullanılacak? İşletim sisteminin hangi versiyonu kullanılacak? Ekran okuyucu bu işletim sistemi ve versiyonuyla uyumlu mu?

Hangi sentezleyiciler destekleniyor?

Ekran okuyucunun çalışmadığı, renk ayarları, ekran çözünürlüğü, ekran kartları vb. Standart sistem konfigürasyonları var mı?

Ekran okuyucu programın, kullanılması muhtemel uygulamalarla uyum sorunu var mı? Kullanıcının beceri seviyesi ve tercihine göre ayarlamalar yapmak mümkün mü?

Kullanıcının, körcül olmayan bir programı kullanılabilir hale getirmesi için ne yapması gerekiyor?

Ekran okuyucu programın sahip olduğu faydalı ve kendine özgü özellikler neler?

Ekran okuyucu, Windows kullanımında problem çıkarıyor mu?

Kullanım kılavuzu doğru ve erişilebilir mi?

Programın kullanımını öğreten materyal var mı? Bu materyal kullanılabilir bir formatta mı?


Konuşma Sistemleri: Ürünler ve Kaynakları

A.     Konuşma Sentezleyiciler

Ürün

Tanım

Firma

Accent:

Dahili Ve Harici Sentezleyiciler Mevcut; Aynı Zamanda Laptop Ve Notebook’ların PCMCIA Slot’u İçin Messenger-IC Kartı Var.

AICOM Corp.

Apollo:

Dahili Ve Harici Mevcut; Desteklediği Diller Arasında Türkçe De Var.

Dolphin Computer Access LLC.

Artic Spirit:

Batari Destekli, Ucuz Bir Ürün.

Artic Technologies. 299 USD.

Artic Synphonix P27:

PCMCIA Kartı.

Artic Technologies. 795USD.

Artic Transport:

Harici; Batari Destekli Ve Taşınabilir.

Artic Technologies.

Dectalk Access32:

Yazılım-Tabanlı.

Solectron.

Dectalk Express:

Küçük, Batari Destekli Sentezleyici.

Solectron.

Dectalk PC2:

Dahili Kart.

Solectron. 1195USD.

Double Talk:

Dahili Ve Harici Sentezleyiciler.

RC Systems, Inc.

Keynote Gold:

Dahili Ve Harici; Aynı Zamanda PCMCIA Kartı.

Humanware, Inc.

Keynote Multi-Media:

Yazılım-Tabanlı.

Humanware, Inc.

Microsoft Speech Engine:

Yazılım-Tabanlı, Ücretsiz.

Microsoft.

Smartalk:

Küçük, Harici, Batari Destekli Sentezleyici.

Automated Functions,

Sounding Board:

Dahili Kart.

Gw Micro.

Speak-Out:

Küçük, Batari Destekli.

Gw Micro.

Triple Talk:

Dahili Ve Harici, Usb Ve Paralel Versiyonları Mevcut.

Access Solutions.

B.    Windows-Tabanlı Ekran Okuyucular

Ürün

Tanım

Firma

Fiyat

Artic Winvision:

Windows 95 Ve 98.

Artic Technologies.

595 USD

Hal:

Windows 95/98, Windows NT

Dolphin Computer Access.

575 / 925 USD

JAWS For Windows:

Windows 95/98 Ve NT/2000PRO.

Freedom Scientific.

795 / 1495 USD

Outspoken For Windows:

Windows 95/98.

Alva Access Group.

695 USD

Window Bridge:

Windows 95/98; Windows Nt 4/Windows 2000.

Syntha-Voice Computers.

795 / 1195 USD

Window-Eyes:

Windows 95/98.

Gw Micro.

595 USD

C.     Web Tarayıcılar

Ürün

Tanım

Firma

Fiyat

Home Page Reader:

Windows-Tabanlı Web Tarayıcısı; Netscape Navigator Gerekiyor, Ekran Okuyucu Gerekmiyor.

Ibm Accessibility Center.

150 USD.

Pwwebspeak:

Windows-Tabanlı Web Tarayıcısı, Ekran Okuyucu Gerekmiyor.

Issound Corp.

150 USD

D.     Yerel Ürün ve Çözümler

Ürün

Tanım

Firma

Fiyat

Net Okur:

Windows95/98/Me/Nt/2000pro, Internet Explorer Gerekiyor. Web Ortamında Türkçe Sörf Yapabilme Ve Clipborda Kopyalanmış Metinleri Türkçe Dinleyebilme Olanağı. Yazılım-Tabanlı, Bilgisayar Üzerindeki Standart Ses Kartı Yeterli.

Gvz Ses Ve İletişim Hizmetleri A.Ş.

150 USD.

Konuşan Defter:

Windows95/98, Türkçe Destekli, Konuşan Bir Kelime İşlemci. Yazılım-Tabanlı.

Algoritma.

180 USD

Hal+Apollo:

Windows95/98, Ekran Okuyucu Artı Türkçe Dil Desteğiyle, Harici Sentezleyici.

Braille Teknik.

975 USD

 


Yapay Konuşma Sistemleri Alanında Çalışan Firmaların İletişim Bilgileri


AICOM Corporation

2381 Zanker Road, Suite 160

San Jose, CA 95131

Tel: 408-577-0370

Fax: 408-577-0373

IBM Accessibility Center

Building 901, Internal Zip 9171

11400 Burnet Road

Austin, TX 78758

Tel: 800-426-4832 or 512-838-4598

Web Sitesi        http://www.ibm.com/sns

 

Alva Access Group

436 14th St., Suite 700

Oakland, CA 94612

Tel: 510-451-2582

Fax: 510-451-0878

E-posta:

info@aagi.com

Web Sitesi        http://www.aagi.com/

Independent Living Aids

27 East Mall

Plainview, NY 11803

Tel: 516-752-8080

Fax: 516-752-3135

E-posta:

can-do@independentliving.com

Web Sitesi           http://www.independentliving.com/

 

Artic Technologies International

1000 John R. Road, Suite 108

Troy, MI 48083

Tel: 248-588-7370

Fax: 248-588-2650

E-posta:

info@artictech.com

Web Sitesi           http://www.artictech.com/

 

IsSound Corporation

830 Bear Tavern Rd. Suite 301

Ewing, NJ 08628

Tel: 609-637-0099

Fax: 609-984-8048984-8044

E-posta:

info@issound.com

Web Sitesi        http://www.issound.com/

 

Automated Functions, Inc.

7700 Leesburg Pike, Suite 420

Falls Church, VA 22043

Tel: 703-883-9797

Fax: 703-883-9798

E-Posta              autofunc@tmn.com

 

Microsoft

One Microsoft Way

Redmond, WA 98052-6399

Tel: 800-426-9400

Web Sitesi        http://www.microsoft.com/enable/

Braille Teknik

Osmanağa Mah. Nüshet Efendi Sok. Beşpınar İşhanı, No: 39/4,

K: 2, Kadıköy, İstanbul.

Tel/Fax: +90(216)418 04 24

E-posta:            Brt@ixir.com

Web Sitesi        http://abone.garanti.net.tr/bt

 

MicroTalk Software

3039 Aubert Ave.

Louisville, KY 40206

Tel: 502-897-5789

Fax: 502-721-6083

E-posta:            larry@microtalk.com

Web Sitesi        http://www.microtalk.com/

 

Dolphin Computer Access LLC.

100 South Ellsworth Ave. 4th Floor

San Mateo, CA 94401

Tel: 650-348-7401

Fax: 650-348-7403

E-posta:            dolphin@dolphinusa.com

Web Sitesi           http://www.dolphinusa.com/

 

Ostrich Software L.L.C.

287 Cameo Drive

Danville, CA 94526-1606

Phone: (925) 552-0750

Fax: (925) 838-2958

Web Sitesi        http://www.ostrichsoftware.com/

 

Freedom Scientific

Blindness and Low Vision Group

11800 31st Court N.

St. petersburgh, FL 33716

Tel: (800) 444-4443 or (727) 803-8000

Fax: (727) 803-8001

E-posta:            sales@hj.com

Web Sitesi        http://www.freedomscientific.com/

 

Parrot SA

28Rue Meslay

F. 75503 Paris, France

Tel: (888) 936-0001 (USA) 33 0 1,44,78,81,10

Fax: Fax: 33 0 1,48,87,87,34

E-posta:            mohamed.saighe@parrot.fr

Web Sitesi        http://www.voice-assistant.com/

GVZ Ses ve İletişim Hizmetleri A.Ş.

Ünalan Mah. Ayazma Cad.

Çamlıca İş mrkz. B3 Blok, 81190

Üsküdar, İstanbul.

Tel: +90(216)556 15 31

Fax: +90(216)556 11 88

E-posta:            Info@gvz.com.tr

Web Sitesi:          http://www.gvz.com.tr

 

RC Systems, Inc.

1609 England Avenue

Everett, WA 98203

Tel: 206-355-3800

Fax: 425-355-1098

E-posta:            info@rcsys.com

Web Sitesi:       http://www.rcsys.com/

GW Micro, Inc.

725 Airport North Office Park

Fort Wayne, IN 46825

Tel: 219-489-3671

Fax: 219-489-2608

E-posta:            support@gwmicro.com

Web Sitesi:       http://www.gwmicro.com/

Selectron Corporation

Attention: Carl J. Leeber

115 Flanders Road

PO Box 5147

Westborough, MA 01581

Tel: (508) 599-2400

Fax: (508) 599-2388

E-posta:            carl.leeber@fci.com

Web Sitesi       

http://www.smartmodulartech.com/systems/products/dectalk/dtalk.htm

 

HumanWare, Inc.

6245 King Road

Loomis, CA 95650

Tel: 800-722-3393 or 916-652-7253

Fax: 916-652-7296

Web Sitesi           http://www.humanware.com/

Syntha-Voice Computers, Inc.

300 Queenston Road, Suite 304

Stoney Creek, ON L8G 1A7 Canada

Tel: 800-263-4540 or 905-662-0565

Fax: 905-662-0568

E-posta:            help@synthavoice.on.ca

Web Sitesi           http://www.synthavoice.on.ca/

 

 

Technologies for the Visually Impaired, Inc.

9 Nolan Court

Hauppauge, NY 11788

Tel: 516-724-4479

E-posta:            tvii@concentric.com

Web Sitesi        http://www.tvi-web.com/