-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathREADME.TXT
487 lines (400 loc) · 17.9 KB
/
README.TXT
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆
WHIZ
©2003-2023 Yuichiro Nakada
☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆
1. 『WHIZ』って?
『WHIZ』はとっても賢いっ☆かな漢字変換プログラムです。最新の日本語形態素解析
技術を使っています。このソフトは「Berry Linux」と共に開発されました。Unix OS上
で動きます。
なお、このソフトによって発生したいかなる損害に対しても、中田裕一朗(作者)は
その責務を負いません。御了承ください。
2. 『WHIZ』の特徴
UNIX系OSで動く、クライアント・サーバー型の日本語入力システムです。
とても賢い、最小コスト法を採用しています。(ちょっと違うけどっ☆)
他のソフトでも利用しやすいように、Cannaプロトコルを採用しています。
現在辞書には34万6634語登録されています。
プログラムのサイズが非常に小さいです。(22.2KB)
漢字から仮名へ再変換することができます。(逆変換)
顔文字をサポートしています。
単語学習機能をサポートしています。(0.56-)
独自インプットメソッドをWayland/Gtk2/Gtk3で利用できます。(0.60-)
フリーソフトです。でも、開発を継続させるために、サポートを歓迎します。
3. 『WHIZ』のこれから
ユーザ辞書、学習機能を付けます。
さらに多くの単語を辞書に追加します。
適切な同音異義語を選ぶ処理(AI変換)をするようにします。
コンテキスト(複数カ所の入力)に対応させます。
高速化のため、解析アルゴリズムに少し不備があるので、見直します。
連接辞書をすべて調べるのではなく、必要な部分だけ調べるようにします。(高速化)
単語の情報、用例などを表示できるようにしたいです。
自分自身を賢く(自己学習)し、辞書を自動生成するWhizAIを作ります。
砕けた表現の変換精度も高くしていきます。
現在はバイナリだけの配布となっていますが、いずれはオープンソース化も考えていきたいと思います。
4. 『WHIZ』には何が入っているの ?
/opt/whiz/sbin/whizserver … 仮名漢字変換サーバ (22.2KB)
/opt/whiz/bin/whizkill … 仮名漢字変換サーバ終了プログラム (cannakillで代用可)
/etc/init.d/whiz … Whizサーバを自動起動するためのシェルスクリプト
/opt/whiz/dic/whiz.dic … 単語辞書 (7.5MB)
/opt/whiz/dic/whiz.inx … 単語辞書インデックス
/opt/whiz/dic/connect.dic … 接続辞書
/opt/whiz/dic/connect.inx … 接続辞書インデックス
/opt/whiz/dic/forms.dic … 活用辞書
5. 『WHIZ』を使うには ?
今のところ、以下の環境での動作が確認されています。他の Linux でも使えると思います…。
☆ Berry Linux 0.10 以降
☆ Red Hat Linux 8.0 / 9 / 9.0.93
☆ Red Hat Fedora Core 1 / 2 / 3 / 4 / 5 / 6
☆ Red Hat Fedora 7 / 8
☆ Mandrake 9.1 / 9.2
☆ Knoppix knoppix-0610 / 1109 日本語版
☆ Kanotix
インストールするには、Canna 自体は必要ありませんが Canna が動作する環境が必要です。(Canna と共存することはできますが、同時に使うことはできません。また、入力するために、Canna 対応版 kinput2、SCIM、IIIMF、uim-canna, kimera もしくは同等のソフトウェアが必要です)
☆ Red Hat 系は以下のようにします。
$ su
# rpm -Uvh whiz-*.rpm
# /sbin/chkconfig whiz on
# /sbin/chkconfig canna off
# /etc/init.d/canna stop
# /etc/init.d/whiz start
# exit
☆ Debian 系は以下のようにします。(自己責任でお願いします)
$ su
# apt-get install canna kinput2-canna
# alien -i whiz-*.rpm
# cp /etc/rc.d/init.d/whiz /etc/init.d/whiz
# cd /etc/rc5.d
# ln -s /etc/init.d/whiz S20whiz
# rm *canna
# rm *freewnn-jserver
# reboot
かんながインストールされていない場合、kinput2 が /var/lib/canna/ (もしくは /usr/lib/canna か /etc/canna) 以下のいくつかのファイルを必要とします。必要なファイルは次の通りです。(default.canna default.cbp cannahost)
6. 『WHIZ』をどこからダウンロードするの ?
http://berry-lab.net/whiz/whiz.html からダウンロードできます。
7. 開発履歴
Whiz version 0.62 (Virgo)
2020.3.15(Mon) 〜 2022.12.18(Sun)
whiz.service
immoduleのバグ修正
cmakeを使うようにした
Whiz version 0.61 (UMa)
2017.1.20(Fri) 〜 2017.1.27(Fri)
automake 更新
64bit に対応
Whiz version 0.60 (Lup)
2015.2.4(Wed) 〜 2015.2.12(Thu)
Wayland (gtk immodule) に対応
Whiz version 0.59 (CMa)
2014.11.25(Tue) 〜 2014.12.23(Tue)
Wayland (gtk immodule) に対応した (途中)
Whiz version 0.58 (Taurus)
2008.5.25(Sun) 〜 2008.8.16(Sat)
単語学習機能が変換精度を下げていたのでとりあえず元に戻した
Whiz version 0.57 (Eri)
2007.11.26(Mon) & 2008.5.8(Thu) 〜 2008.5.11(Sun)
文節調整時に辞書がないとおかしな表示をするバグを修正
最大接続数を一度超えると接続を受け付けなくなるバグを修正
単語辞書追加と修正 (34万6634語)
名前辞書を追加 (約30語)
Whiz version 0.56 (Hydra)
2007.11.4(Sun) 〜 2007.11.12(Mon)
連接チェックを行なう単語を選定するようにした (高速化)
解析アルゴリズムを微調整した (高速化&虫取り)
単語辞書追加と修正 (34万6604語)
候補取得の小さなバグを修正
単語学習機能追加のために学習辞書を追加 (~/.whiz/learn.dic)
kimera にも学習機能を追加 (endConvert)
fopen, fclose の回数を減らした (高速化)
Whiz version 0.55 (Bootes)
2007.10.12(Fri) 〜 2007.10.19(Fri)
辞書作成時に登録する必要のない単語を削除する機能を追加
単語辞書追加と修正 (34万6599語)
文節を伸ばす時に文節が削除される場合に対応 (まだ不完全)
解析に失敗した時に「解析失敗」という表示ではなくそのまま表示するように変更
whiz.i 修正 (daemon から service に変更)
Whiz version 0.54 (Lepus)
2007.4.4(Wed) 〜 2007.4.11(Wed)
辞書のインデックスのバイナリー化をサポート (サイズ削減&高速化)
漢字の再変換をサポート (辞書の線形逆引きにより)
名前辞書を追加 (約500語)
単語辞書追加と修正 (34万6597語)
Whiz version 0.53 (Pisces)
2006.10.14(Sat) 〜 2006.10.14(Sat)
kimera での動作を確認 (resize_pause 直接の「読みの長さ」指定に対応)
whiz.i を追加 (initng 対応のため)
単語辞書追加と修正 (34万6089語)
Whiz version 0.52 (Indus)
2006.3.12(Sun) 〜 2006.3.13(Mon)
jrkanji ライブラリの改良
かな入力方式のサポート (KC_CHANGERULE の追加)
F6 キーで「ひらがな」入力モードへ
F6 〜 F10 キーで入力モードを変更できるようにした
単語辞書追加と修正 (34万5973語)
Whiz version 0.51 (Delphinus)
2005.9.16(Fri) 〜 2005.9.21(Wed)
jrkanji ライブラリをさらに改良
文節を縮める時のバグを直した
単語辞書追加と修正 (34万5960語)
一部オープンソース化
Whiz version 0.50 (Sagittarius)
2005.8.15(Mon) 〜 2005.8.25(Thu)
jrkanji ライブラリに対応
単語辞書追加と修正 (34万5950語)
Whiz version 0.49 (Monoceros)
2004.12.25(Sat) 〜 2005.1.3(Mon)
単語辞書追加と修正 (34万5918語)
SCIM に対応 (get_dictionary_list 追加)
Whiz version 0.48 (Andromeda)
2004.7.27(Tue) 〜 2004.8.11(Wed)
単語辞書追加と修正 (34万5895語)
名前を辞書に追加
「う゛ぁ」を片仮名に変換する時に、「ウ゛ァ」ではなく「ヴァ」となるようにした
デバッグメッセージを直した
Whiz version 0.47 (Taw)
2004.4.23(Fri) 〜 2004.5.5(Wed)
単語辞書追加と修正 (32万4671語)
名前を辞書に追加
Whiz version 0.46 (Shin)
2004.2.29(Sun) 〜 2004.2.29(Sun)
連接辞書をソートし無駄な検索を省くようにした (高速化)
単語辞書追加と修正 (31万6758語)
Whiz version 0.45 (Rehsh)
2004.2.20(Fri) 〜 2004.2.21(Sat)
「install.sh」のバグ修正
連接辞書の無駄を省いた
単語辞書追加と修正 (31万6750語)
Whiz version 0.44 (Qohph)
2004.1.22(Thu) 〜 2004.2.7(Sat)
名前を辞書に追加
単語辞書追加と修正 (31万6748語)
顔文字を「かおもじ」で登録
文節の区切りを変更するプログラムの見直し (一部)
Whiz version 0.43 (Tsadheh)
2004.1.12(Mon) 〜 2004.1.14(Wed)
名前を辞書に追加
単語辞書追加と修正 (31万4327語)
候補を取得する時に選ばれている単語を一番初めに表示するようにした
Whiz version 0.42 (Pe)
2003.12.17(Wed) 〜 2003.12.18(Thu)
単語辞書インデックスを半角に対応させた
顔文字のサポート (辞書が半角スペースに対応)
ソースを綺麗にした
単語辞書追加と修正 (31万2070語)
Whiz version 0.41 (Ayin)
2003.12.9(Tue) 〜 2003.12.13(Sat)
文法辞書作成プログラムの活用型を判断する部分を新しくした
辞書作成プログラムの更新
辞書のバイナリー化をサポート (高速化)
単語辞書追加と修正 (31万2027語)
Whiz version 0.40 (Samekh)
2003.12.2(Tue) 〜 2003.12.4(Thu)
単語辞書追加と修正 (31万1975語)
ほんの少し無駄をなくした (高速化)
Whiz version 0.39 (Nun)
2003.11.24(Mon) 〜 2003.11.27(Thu)
名前を辞書に追加
連接辞書の修正 (24578行)
単語辞書追加と修正 (31万1908語)
解析アルゴリズムの解析深度を増やした
Whiz version 0.38 (Mem)
2003.11.19(Wed) 〜 2003.11.21(Fri)
単語辞書追加と修正 (31万1074語)
「whizcui」の方にも「基本形-促音便」という活用型を追加した
Whiz version 0.37 (Lamedh)
2003.11.8(Sat) 〜 2003.11.10(Mon)
単語辞書がない時、強制終了しないようにした
「基本形-促音便」という活用型を追加した
連接辞書の修正 (24568行)
単語辞書追加と修正 (31万0998語)
コンパイルオプションを変更した (-O2 -Os)
Whiz version 0.36 (Kaph)
2003.11.3(Mon) 〜 2003.11.7(Fri)
名前を辞書に追加
単語辞書追加と修正 (31万0902語)
サーバー側で半角文字の入力を受け付けるようにした (辞書を引く部分が未完了)
Whiz version 0.35 (Yohdh)
2003.10.29(Wed) 〜 2003.10.30(Thu)
単語辞書追加と修正 (30万4842語)
候補を取得する部分で正しい文字数を返さないバグを直した
余分な候補を出さないようにした
Whiz version 0.34 (Tehth)
2003.10.20(Mon) 〜 2003.10.21(Tue)
名前を辞書に追加
単語辞書追加と修正 (30万4833語)
サーバーのソースを整理整頓
Whiz version 0.33 (Chehth)
2003.10.3(Fri) 〜 2003.10.7(Tue)
単語辞書追加と修正 (30万3987語)
クライアントへの送信部分を一箇所にまとめた
Whiz version 0.32 (Zayin)
2003.9.27(Sat) 〜 2003.10.2(Thu)
単語辞書追加と修正 (30万3983語)
連接辞書の修正 (25442行)
名前を辞書に追加
Whiz version 0.31 (Waw)
2003.9.23(Tue) 〜 2003.9.24(Wed)
サーバーのソースを調整
単語辞書追加と修正 (30万3532語)
Whiz version 0.30 (He)
2003.9.21(Sun) 〜 2003.9.21(Sun)
名前を辞書に追加
単語辞書追加と修正 (30万3531語)
サーバーのソースを微調整
Whiz version 0.29 (Daleth)
2003.9.8(Mon) 〜 2003.9.13(Sat)
単語辞書追加と修正 (30万2878語)
サーバーのソースを綺麗に
名前を辞書に追加
Whiz version 0.28 (Gimel)
2003.8.28(Thu) 〜 2003.8.30(Sat)
名前を辞書に追加
単語辞書追加と修正 (30万1784語)
サーバーのソースを綺麗に
半角に対応した(入力を除く部分)
Whiz version 0.27 (Behth)
2003.8.20(Wed) 〜 2003.8.27(Wed)
単語辞書追加と修正 (30万1124語)
サーバーのソースを綺麗にした
Whiz version 0.26 (Aleph)
2003.8.16(Sat) 〜 2003.8.17(Sun)
単語辞書追加と修正 (30万1122語)
候補を取得するところをかんなのワイドキャラクタに対応した
Whiz version 0.25 (Omega)
2003.8.8(Fri) 〜 2003.8.9(Sat)
ソースを綺麗にした
名前を辞書に追加
単語辞書追加と修正 (30万1035語)
Whiz version 0.24 (Psi)
2003.8.6(Wed) 〜 2003.8.7(Thu)
解析アルゴリズムの微調整 (高速化)
名前を辞書に追加
単語辞書追加と修正 (30万745語)
Whiz version 0.23 (Chi)
2003.8.1(Fri) 〜 2003.8.1(Fri)
名前を辞書に追加
単語辞書追加と修正 (29万9785語)
Whiz version 0.22 (Phi)
2003.7.27(Sun) 〜 2003.7.27(Sun)
単語辞書追加と修正 (29万6971語)
解析アルゴリズムの無駄を省いた (高速化&少し賢くなります)
Whiz version 0.21 (Upsilon)
2003.7.26(Sat) 〜 2003.7.26(Sat)
単語辞書追加と修正 (29万6968語)
最後の単語を二重に調べるバグを直した
解析アルゴリズムの微調整
簡易辞書登録ツールCUIの修正
注意:少し処理が重いです
Whiz version 0.20 (Tau)
2003.7.23(Wed) 〜 2003.7.25(Fri)
単語辞書追加と修正 (29万6959語)
簡易辞書登録ツールCUIを添付
注意:少し処理が重いです
Whiz version 0.19 (Sigma)
2003.7.20(Sun) 〜 2003.7.21(Mon)
単語辞書追加と修正 (29万6920語)
解析アルゴリズムの解析量を少し増やした
簡易辞書登録ツール暫定版を添付
バイナリーパッケージの配布開始
Whiz version 0.18 (Rho)
2003.7.17(Thu) 〜 2003.7.18(Fri)
名前に「"」がはいっていたのを直した
単語辞書追加と修正 (29万6876語)
辞書作成時に複数の活用形に対応するように直した
Whiz version 0.17 (Pi)
2003.7.12(Sat) 〜 2003.7.15(Tue)
単語辞書追加と修正 (29万6903語)
複数の活用形に対応するように直した
Whiz version 0.16 (Omicron)
2003.7.10(Thu) 〜 2003.7.11(Fri)
単語辞書追加と修正 (29万6887語)
ほんの少しソースをまとめた
単語候補をよくでる順に並び変えるようにした
Whiz version 0.15 (Xi)
2003.7.4(Fri) 〜 2003.7.7(Mon)
単語辞書追加と修正 (29万6871語)
全体的なソース修正
暫定的に文節の区切りを変更できるようにした
Whiz version 0.14 (Nu)
2003.7.1(Tue) 〜 2003.7.2(Wed)
「Whiz AI」の開発開始
単語辞書追加と修正 (29万6852語)
ソースを少しまとめた
辞書検索ルーチンを少し効率化 (高速化)
Whiz version 0.13 (Mu)
2003.6.28(Sat) 〜 2003.6.30(Mon)
解析アルゴリズムを少し変更 (ソースを綺麗にした&バグ修正)
単語辞書追加と修正 (29万6849語)
連接辞書の追加 (25953行)
Whiz version 0.12 (Lambda)
2003.6.23(Mon) 〜 2003.6.25(Wed)
サーバへのリクエスト処理を追加
サーバへの終了処理を受け付けるようにした
「Whiz Killer」を追加
独自の単語を追加・修正
名前を辞書に追加
単語辞書追加と修正 (29万6844語)
解析アルゴリズムの修正 (少し無駄をなくした)
単語辞書インデックスを修正した (高速化)
Whiz version 0.11 (Kappa)
2003.6.20(Fri) 〜 2003.6.21(Sat)
独自の単語を追加・修正
名前を辞書に追加
単語辞書追加と修正 (29万1702語)
辞書作成プログラムの修正
重複している単語をチェックするようにした
Whiz version 0.10 (Iota)
2003.6.18(Wed) 〜 2003.6.19(Thu)
連接辞書を引くとき原型で調べるように直した
単語辞書追加 (25万語)
連接辞書追加 (25951行)
独自の単語を追加 (記号、名詞など)
解析する時に小さい順に並べるところの不具合を直した
解析に失敗した時の処理を加えた
検索バッファがあふれた時の処理を加えた
単体での配布開始
Whiz version 0.09 (Theta)
2003.6.11(Wed) 〜 2003.6.17(Tue)
解析アルゴリズムの修正
サーバの修正
候補を変えることができるようにした
RPMを作成し「Berry Linux」に搭載
Whiz version 0.08 (Eta)
2003.6.9(Mon) 〜 2003.6.10(Tue)
フォルダごとに管理するようにした
autoconf, automakeを使用することにした
解析エンジンを修正
単語全てが活用する場合にも対応した
活用形を調べるときのバグを直した
前の単語との連接数を制限するように解析アルゴリズムを変えた
Whiz version 0.07 (Zeta)
2003.6.4(Wed) 〜 2003.6.8(Sun)
サーバの修正
かな漢字変換エンジン「WHIZ」と「Whiz Server」を接続
Whiz version 0.06 (Epsilon)
2003.5.29(Thu) 〜 2003.6.3(Tue)
サーバとクライアントの基礎部分完成
Whiz version 0.05 (Delta)
2003.5.20(Tue) 〜 2003.5.28(Wed)
解析アルゴリズムを修正し、一つの単語に候補数を指定できるようにした
活用型、活用形辞書「forms.dic」追加
単語辞書の単語を、変化しない部分だけ登録するように変更した
辞書を検索する時に活用形も調べるようにした
解析エンジン基礎完成
Whiz version 0.04 (Gamma)
2003.5.19(Mon) 〜 2003.5.19(Mon)
解析アルゴリズムの修正
一つずつチェックしていく解析アルゴリズムを追加
同じ長さの単語をいっぺんに解析するアルゴリズムの修正
Whiz version 0.03 (Beta)
2003.5.18(Sun) 〜 2003.5.18(Sun)
高速化
連接辞書にインデックスを付けた
Whiz version 0.02 (Alpha)
2003.5.16(Fri) 〜 2003.5.17(Sat)
細かいバグ修正
Whiz version 0.01 (Beta)
2003.5.8(Thu) 〜 2003.5.15(Thu)
中心基礎部分完成
連接辞書「connect.dic」追加 (12700行)
品詞辞書「grammar.dic」追加
単語辞書「whiz.dic」追加 (24万5千語)
単語辞書にインデックスを付けた