English page
SourceForge.net Logo

目的

本プロジェクトの目的はOpenOffice.org/StarOffice/StarSuite(以下“OpenOffice.org”と記述します)で富士通OASYSフォーマットの文書を読み込むことができるようにすることです。



OASYSについて

富士通OASYS1980年代から日本で広く使われていたワードプロセッサです。パソコン上で動作するOASYSも開発され、Windows Vistaにも対応しています。

ワードプロセッサとしてのシェアは過去にはプロユースでは非常に高かったのですが、パソコンの低価格化とMicrosoft Officeのバンドル戦略に押されかなり低下しています。現在でも役所や会社、一部の人たちの間で利用されています。



シナリオ

シナリオ1:OASYSを過去に利用していた人

OASYSを過去に利用していた人は大量のOASYSデータ資産を持っています。そのような人がデータを利用するためには次の方法があります。

OpenOffice.orgOASYSをインポートするフィルタを作成することにより、OASYSデータ資産を所有者にもう一つの選択肢を提供し、OpenOffice.orgへの移行を促すことができます。

シナリオ2:OASYSを現在利用している人

OASYSを現在利用している人は非常に強いこだわりがあるため、移行を促すことが難しいと考えられます。OASYSにはODF(Open Document Format)にデータをエクスポートする機能がありません。そのため、OpenOffice.orgとのデータのやりとりが困難です。OpenOffice.orgOASYSデータをインポートする機能を提供することにより、OASYS利用者とのデータ交換が容易になります。



実装方針

初期はOpenOffice.orgunoプラグインとして開発します。言語はJavaとします。将来的にはC++で記述してswモジュールのフィルタとして組み込めるようにすることを目標としています。



技術

概要

OASYSではバージョンによって次の形式があります。

一番流通しているのは“OA2”ファイル形式です。



OASYS1980年ごろから提供されていたため、JIS12水準の区点コードを流用していますが、一部区番号に変更が加えられています。



OASYS区点コード

OASYSの区点コードはJIS X 0208.1983をベースに区の変更と富士通独自文字の割り当てがあります。Japanist 2002およびOASYS 2002より求めた結果が表 1です。



1:OASYSJIS X 0208の区の対応

OASYS区点コード

JIS X 0208.1983区点コード

01―07

同じ。

一部特殊割り当てあり

08―15

87―94区に対応

16―83

同じ

84―92

95―103

実際にデータは無いがUnicodeprivate use area(U+E000からU+E34D)への対応がある

93

104

94

84

8407点以降は“・”U+30FBへのマップがある

95区―103

全角外字

104

半角外字

OASYS区点コードからUnicodeへ変換する関数を作成するのが第一ステップとなります。

また、JIS X 0208からUnicodeへ変換する関数はsal/textenc/tcvtjp*.tabにあります。



OASYS区点コードからUnicodeへの変換

OASYS区点コードからUnicodeへ変換する場合には次の方式で割り当てます。



また、OASYSの区点コードでは、JIS X 0208の未定義文字を“・”(U+30FB)に割り当てていますが、OpenOffice.orgでは0に割り当てているため、OpenOffice.org方式を採用します。







2:OASYS独自文字とUnicodeの対応(04)

OASYS区点コード

Unicode Scalar Value

備考

0484 []

U+3094

多重定義

0485[]

U+3095

JapanistではU+F2B9

0486[]

U+3096

JapanistではU+F2BA

上記以外


JIS X 0208と同一



3:OASYS独自文字とUnicodeの対応(08)

OASYS区点コード

Unicode Scalar Value

備考

0801 []

U+FFE4


0802 []

U+FF07


0803 []

U+FF02


0804―0806 なし

U+FFFC


08-07 []

U+FFE2


0808 [∵]

U+2235


0809 [≒]

U+2252


0810 [≡]

U+2261


0811―0813 なし

U+FFFC


0814 [◁]

U+25C1


0815 [▷]

U+25B7


0816 [⇩]

U+21E9


0817 [⇧]

U+21E7


0818 [⇦]

U+21E6


0819 [⇨]

U+21E8


0820 [▢]

U+25A2


0821 [♧]

U+2667


0822 [♡]

U+2261


0823 [♤]

U+2664


0824 [♢]

U+2662


0825―0827 なし

U+FFFC


0828 []

U+339C


0829 []

U+339D


0830 []

U+339E


0831 []

U+33A0


0832 []

U+33A1


0833 []

U+33A2


0834 []

U+33A4


0835 []

U+33A5


0836 []

U+338E


0837 []

U+338F


0838 []

U+33C4


0839 []

U+3397


0840 []

U+2113


0841 []

U+3398


0842 []

U+33B3


0843 []

U+33B2


0844 []

U+33B1


0845 []

U+33B0


0846 []

U+3385


0847 []

U+3386


0848 []

U+3387


0849 []

U+212B


0850 []

U+33CB


0851 []

U+2030


0852 []

U+3390


0853 []

U+33D4


0854 なし

U+FFFC


0855 []

U+3396


0856 なし

U+FFFC


0857 []

U+334D


0858 []

U+3349


0859 []

U+3322


0860 []

U+3314


0861 []

U+3316


0862 []

U+3318


0863 []

U+3315


0864 []

U+3327


0865 []

U+3303


0866 []

U+3336


0867 []

U+3326


0868 []

U+3323


0869 []

U+332B


0870 []

U+330D


0871 []

U+3357


0872 []

U+3342


0873 []

U+334A


0874 []

U+3339


0875 []

U+333B


0876 []

U+3300


0877 []

U+3331


0878 []

U+3347


0879 []

U+331E


0880 []

U+332A


0881―0883 なし

U+FFFC


0884 []

U+33CD

JapanistではU+F53B

0885 []

U+337F


0886 []

U+2121


0887 []

U+260E


0888 []

U+3036


0889 []

U+3020


0890 []

U+2116


0891 [©]

U+00A9

JapanistではU+F7FD

0892―0893 なし

U+FFFC


0894 [®]

U+00AE

Japanistでは U+F800



4:OASYS独自文字とUnicodeの対応(09)

OASYS区点コード

Unicode Scalar Value

備考

0901―0908 なし

U+FFFC


0909 点付き数字0.

U+1F100

2008-May-16 accepted

JapanistではU+F319 (private use area)

0910 []

U+2488


0911 []

U+2489


0912 []

U+248A


0913 []

U+248B


0914 []

U+248C


0915 []

U+248D


0916 []

U+248E


0917 []

U+248F


0918 []

U+2490


0919 なし

U+FFFC


0920 []

U+2474


0921 []

U+2475


0922 []

U+2476


0923 []

U+2477


0924 []

U+2478


0925 []

U+2479


0926 []

U+247A


0927 []

U+247B


0928 []

U+247C


0929 []

U+247D


0930 []

U+247E


0931 []

U+247F


0932 []

U+2480


0933 []

U+2481


0934 []

U+2482


0935 []

U+2483


0936 []

U+2484


0937 []

U+2485


0938 []

U+2486


0939 [⒇]

U+2487


0940 なし

U+FFFC


0941 []

U+2460


0942 []

U+2461


0943 []

U+2462


0944 []

U+2463


0945 []

U+2464


0946 []

U+2465


0947 []

U+2466


0948 []

U+2467


0949 []

U+2468


0950 []

U+2469


0951 []

U+246A


0952 [⑫]

U+246B


0953 [⑬]

U+246C


0954 []

U+246D


0955 []

U+246E


0956 []

U+246F


0957 []

U+2470


0958 []

U+2471


0959 []

U+2472


0960 []

U+2473


0961 []

U+3251

Japanistではprivate use area

0962 []

U+2160


0963 []

U+2161


0964 []

U+2162


0965 []

U+2163


0966 []

U+2164


0967 []

U+2165


0968 []

U+2166


0969 []

U+2167


0970 []

U+2168


0971 []

U+2169


0972―0974 なし

U+FFFC


0975 []

U+2170


0976 []

U+2171


0977 []

U+2172


0978 []

U+2173


0979 []

U+2174


0980 []

U+2175


0981 []

U+2176


0982 []

U+2177


0983 []

U+2178


0984 []

U+2179


0985 []

U+3252

Japanistではprivate use area

0986 []

U+3253

Japanistではprivate use area

0987 []

U+3254

Japanistではprivate use area

0988 []

U+3255

Japanistではprivate use area

0989 []

U+3256

Japanistではprivate use area

0990 []

U+3257

Japanistではprivate use area

0991 []

U+3258

Japanistではprivate use area

0992 []

U+3259

Japanistではprivate use area

0993 []

U+325A

Japanistではprivate use area

0994 []

U+325B

Japanistではprivate use area



5:OASYS独自文字とUnicodeの対応(10)

OASYS区点コード

Unicode Scalar Value

備考

1001 [⒜]

U+249C


1002 []

U+249D


1003 []

U+249E


1004 []

U+249F


1005 []

U+24A0


1006 [⒡]

U+24A1


1007 []

U+24A2


1008 []

U+24A3


1009 []

U+24A4


1010 []

U+24A5


1011 []

U+24A6


1012 []

U+24A7


1013 []

U+24A8


1014 []

U+24A9


1015 []

U+24AA


1016 []

U+24AB


1017 []

U+24AC


1018 []

U+24AD


1019 []

U+24AE


1020 []

U+24AF


1021 []

U+24B0


1022 []

U+24B1


1023 []

U+24B2


1024 []

U+24B3


1025 []

U+24B4


1026 []

U+24B5


1027―1036 なし

U+FFFC


1037 []

U+3094


多重定義

1038―1040 なし

U+FFFC


1041 []

U+3243


1042 []

U+323D


1043 []

U+3239


1044 []

U+323F


1045 []

U+3234


1046 []

U+3238


1047 []

U+3232


1048 []

U+3233


1049 []

U+323C


1050 []

U+3242


1051 []

U+323E


1052 []

U+3236


1053 []

U+3231


1054 []

U+3235


1055 []

U+323B


1056 []

U+3240


1057 []

U+323A


1058―1060 なし

U+FFFC


1061 []

U+32B0


1062 []

U+32AD


1063 []

U+32A9


1064 []

U+32AF


1065 []

U+3294


1066 []

U+32AA


1067 []

U+3298


1068 []

U+32AB


1069 []

U+3292


1070 []

U+3291


1071 []

U+3293


1072 []

U+32AC


1073 []

U+32AE


1074 []

U+3296


1075―1078 なし

U+FFFC


1079―1094 括弧くくり素片

U+FFFD

Japanistではprivate use area

U+23A7―U+23ADBracket piecesがあるが少し違うため割り当てを実施しない。



6:OASYS独自文字とUnicodeの対応(11)

OASYS区点コード

Unicode Scalar Value

備考

1101―1164 グラフ素片

U+FFFD

Japanistではprivate use area

1165 []

U+2550


1166 []

U+2554


1167 []

U+2557


1168 []

U+2566


1169 []

U+2563


1170 []

U+2564


1171 太線二重罫線混在素片

U+FFFD

JapanistではU+F287

1172 []

U+2565


1173 太線二重罫線混在素片

U+FFFD

JapanistではU+F288

1174 細線二重罫線混在素片

U+FFFD

JapanistではU+F289

1175 細線二重罫線混在素片

U+FFFD

JapanistではU+F28A

1176 太線二重罫線混在素片

U+FFFD

JapanistではU+F28B

1177 太線二重線混在素片

U+FFFD

JapanistではU+F28C

1178 []

U+2562


1179 太線二重線混在素片

U+FFFD

JapanistではU+F28D

1180 []

U+2561


1181 太線二重線混在素片

U+FFFD

JapanistではU+F28E

1182 細線二重線混在素片

U+FFFD

JapanistではU+F28F

1183 細線二重線混在素片

U+FFFD

JapanistではU+F290

1184 太線二重線混在素片

U+FFFD

JapanistではU+F291

1185 太線二重線混在素片

U+FFFD

JapanistではU+F292

1186 []

U+256A


1187太線二重線混在素片

U+FFFD

JapanistではU+F293

1188 細線二重線混在素片

U+FFFD

JapanistではU+F294

1189 細線二重線混在素片

U+FFFD

JapanistではU+F295

1190 太線二重線混在素片

U+FFFD

JapanistではU+F296

1191 太線二重線混在素片

U+FFFD

JapanistではU+F297

1192 点線二重線混在素片

U+FFFD

JapanistではU+F298

1193 点線二重線混在素片

U+FFFD

JapanistではU+F299

1194 点線二重線混在素片

U+FFFD

JapanistではU+F29A



7:OASYS独自文字とUnicodeの対応(12)

OASYS区点コード

Unicode Scalar Value

備考

1201 点線素片

U+FFFD

JapanistではU+F349

1202 点線素片

U+FFFD

JapanistではU+F34A

1203 点線素片

U+FFFD

JapanistではU+F34C

1204 点線素片

U+FFFD

JapanistではU+F34B

1205 []

U+2504


1206 []

U+2506


1207 点線素片

U+FFFD

JapanistではU+F34E

1208 点線素片

U+FFFD

JapanistではU+F34F

1209 点線素片

U+FFFD

JapanistではU+F34D

1210 点線素片

U+FFFD

JapanistではU+F350

1211 点線素片

U+FFFD

JapanistではU+F351

1212 点線素片

U+FFFD

JapanistではU+F390

1213 点線素片

U+FFFD

JapanistではU+F391

1214 点線素片

U+FFFD

JapanistではU+F392

1215 点線素片

U+FFFD

JapanistではU+F395

1216 点線素片

U+FFFD

JapanistではU+F394

1217 点線素片

U+FFFD

JapanistではU+F393

1218 細線点線混在素片

U+FFFD

JapanistではU+F353

1219 太線点線混在素片

U+FFFD

JapanistではU+F388

1220 細線点線混在素片

U+FFFD

JapanistではU+F355

1221 太線点線混在素片

U+FFFD

JapanistではU+F389

1222 細線点線混在素片

U+FFFD

JapanistではU+F357

1223 太線点線混在素片

U+FFFD

JapanistではU+F38A

1224 細線点線混在素片

U+FFFD

JapanistではU+F359

1225 太線点線混在素片

U+FFFD

JapanistではU+F38B

1226 細線点線混在素片

U+FFFD

JapanistではU+F35A

1227 太線点線混在素片

U+FFFD

JapanistではU+F37F

1228 []

U+2521


1229 []

U+2522


1230 []

U+253A


1231 []

U+2544


1232 []

U+2545


1233 []

U+250F


1234 []

U+2513


1235 []

U+2517


1236 []

U+251B


1237 []

U+2501


1238 []

U+2503


1239 []

U+253B


1240 []

U+2523


1241 []

U+2533


1242 []

U+252B


1243 []

U+254B


1244 太線素片

U+FFFD

JapanistではU+F39E

1245 太線素片

U+FFFD

JapanistではU+F39F

1246 []

U+2579


1247 []

U+257A


1248 []

U+257B


1249 []

U+2578


1250 太線点線混在素片

U+FFFD

JapanistではU+F37B

1251 []

U+2537


1252 太線点線混在素片

U+FFFD

JapanistではU+F37C

1253 []

U+2520


1254 太線点線混在素片

U+FFFD

JapanistではU+F37D

1255 []

U+252F


1256 太線点線混在素片

U+FFFD

JapanistではU+F37E

1257 []

U+2528


1258 太線点線混在素片

U+FFFD

JapanistではU+F380

1259 []

U+253F


1260 []

U+2529


1261 []

U+252A


1262 []

U+2539


1263 []

U+2543


1264 []

U+2546


1265 []

U+250C


1266 []

U+2510


1267 []

U+2514


1268 []

U+2518


1269 []

U+2500


1270 []

U+2502


1271 []

U+2534


1272 []

U+251C


1273 []

U+252C


1274 []

U+2524


1275 []

U+253C


1276 細線素片

U+FFFD

JapanistではU+F396

1277 細線素片

U+FFFD

JapanistではU+F397

1278 []

U+2575


1279 []

U+2576


1280 []

U+2577


1281 []

U+2574


1282 細線点線混在素片

U+FFFD

JapanistではU+F352

1283 []

U+2538


1284 細線点線混在素片

U+FFFD

JapanistではU+F354

1285 []

U+251D


1286 細線点線混在素片

U+FFFD

JapanistではU+F356

1287 []

U+2530


1288 細線点線混在素片

U+FFFD

JapanistではU+F358

1289 []

U+2525


1290 細線点線混在素片

U+FFFD

JapanistではU+F35B

1291 []

U+2542


1292 []

U+2532


1293 []

U+2531


1294 []

U+256C




8:OASYS独自文字とUnicodeの対応(13)

OASYS区点コード

Unicode Scalar Value

備考

1301―1364 グラフ素片

U+FFFD

Japanistではprivate use area

1365 []

U+2551


1366 []

U+255A


1367 []

U+255D


1368 []

U+2569


1369 []

U+2560


1370 []

U+2567


1371 太線二重線混在素片

U+FFFD

JapanistではU+F29B

1372 []

U+2568


1373 太線二重線混在素片

U+FFFD

JapanistではU+F29C

1374 細線二重線混在素片

U+FFFD

JapanistではU+F29D

1375 細線二重線混在素片

U+FFFD

JapanistではU+F29E

1376 太線二重線混在素片

U+FFFD

JapanistではU+F29F

1377 太線二重線混在素片

U+FFFD

JapanistではU+F2A0

1378 []

U+255F


1379 太線二重線混在素片

U+FFFD

JapanistではU+F2A1

1380 []

U+255E


1381 太線二重線混在素片

U+FFFD

JapanistではU+F2A2

1382 細線二重線混在素片

U+FFFD

JapanistではU+F2A3

1383 細線二重線混在素片

U+FFFD

JapanistではU+F2A4

1384 太線二重線混在素片

U+FFFD

JapanistではU+F2A5

1385 太線二重線混在素片

U+FFFD

JapanistではU+F2A6

1386 []

U+256B


1387 太線二重線混在素片

U+FFFD

JapanistではU+F2A7

1388 細線二重線混在素片

U+FFFD

JapanistではU+F2A8

1389 細線二重線混在素片

U+FFFD

JapanistではU+F2A9

1390 太線二重線混在素片

U+FFFD

JapanistではU+F2AA

1391 太線二重線混在素片

U+FFFD

JapanistではU+F2AB

1392 点線二重線混在素片

U+FFFD

JapanistではU+F2AC

1393 点線二重線混在素片

U+FFFD

JapanistではU+F2AD

1394 点線二重線混在素片

U+FFFD

JapanistではU+F2AE



9:OASYS独自文字とUnicodeの対応(14)

OASYS区点コード

Unicode Scalar Value

備考

1401 縦書[]

U+3001

JapanistではU+F7CC

1402 縦書[]

U+3002

JapanistではU+F7CD

1403 縦書全角コンマ

U+FF0C

JapanistではU+F7CE

1404 縦書全角ピリオド

U+FF0E

JapanistではU+F7CF

1405 縦書全角オーバーライン

U+FFE3

FULLWIDTH MACRON

JapanistではU+F7D0

1406 縦書全角アンダーライン

U+FF3F

JapanistではU+FE33

なぜここにあるかは不明

1407 縦書長音[]

U+30FC

JapanistではU+FE32

1408 縦書ダッシュ[―]

U+2015

JapanistではU+FE31

1409 縦書ハイフン[-]

U+2010

JapanistではU+F7D1

1410 縦書波ダッシュ []

U+FF5E

JapanistではU+F7D2

1411 縦書 []

U+2225

JapanistではU+F7D3

1412 縦書 []

U+FF5C

JapanistではU+F7D4

1413 縦書三点リーダ[…]

U+2026

JapanistではU+F7D5

1414 縦書二点リーダ [‥]

U+2025

JapanistではU+FE30

1415 縦書左シングル引用符

U+2018

JapanistではU+F7D6

1416 縦書右シングル引用符

U+2019

JapanistではU+F7D7

1417 縦書左ダブル引用符

U+201C

JapanistではU+F7D8

1418 縦書右ダブル引用符

U+201D

JapanistではU+F7D9

1419 縦書始め小括弧

U+FF08

JapanistではU+FE35

1420 縦書終わり小括弧

U+FF09

JapanistではU+FE36

1421 縦書始め亀甲括弧

U+3014

JapanistではU+FE39

1422 縦書終わり亀甲括弧

U+3015

JapanistではU+FE3A

1423 縦書始め大括弧

U+FF3B

JapanistではU+F7DA

1424 縦書終わり大括弧

U+FF3D

JapanistではU+F7DB

1425 縦書始め中括弧

U+FF5B

JapanistではU+FE37

1426 縦書終わり中括弧

U+FF5D

JapanistではU+FE38

1427 縦書始め山括弧

U+3008

JapanistではU+FE3F

1428 縦書終わり山括弧

U+3009

JapanistではU+FE40

1429 縦書始め二重山括弧

U+300A

JapanistではU+FE3D

1430 縦書終わり二重山括弧

U+300B

JapanistではU+FE3E

1431 縦書始めかぎ括弧

U+300C

JapanistではU+FE41

1432 縦書終わりかぎ括弧

U+300D

JapanistではU+FE42

1433 縦書始め二重かぎ括弧

U+300E

JapanistではU+FE43

1434 縦書終わり二重かぎ括弧

U+300F

JapanistではU+FE44

1435 縦書始めすみつき括弧

U+3010

JapanistではU+FE3B

1436 縦書終わりすみつき括弧

U+3011

JapanistではU+FE3C

1437 縦書小文字[]

U+3041

JapanistではU+F7DC

1438 縦書小文字[]

U+3043

JapanistではU+F7DD

1439 縦書小文字[]

U+3045

JapanistではU+F7DE

1440 縦書小文字[]

U+3047

JapanistではU+F7DF

1441 縦書小文字[]

U+3049

JapanistではU+F7E0

1442 縦書小文字[]

U+3063

JapanistではU+F7E1

1443 縦書小文字[]

U+3083

JapanistではU+F7E2

1444 縦書小文字[]

U+3085

JapanistではU+F7E3

1445 縦書小文字[]

U+3087

JapanistではU+F7E4

1446 縦書小文字[]

U+308E

JapanistではU+F7E5

1447 縦書小文字[]

U+30A1

JapanistではU+F7E6

1448 縦書小文字[]

U+30A3

JapanistではU+F7E7

1449 縦書小文字[]

U+30A5

JapanistではU+F7E8

1450 縦書小文字[]

U+30A7

JapanistではU+F7E9

1451 縦書小文字[]

U+30A9

JapanistではU+F7EA

1452 縦書小文字[]

U+30C3

JapanistではU+F7EB

1453 縦書小文字[]

U+30E3

JapanistではU+F7EC

1454 縦書小文字[]

U+30E5

JapanistではU+F7ED

1455 縦書小文字[]

U+30E7

JapanistではU+F7EE

1456 縦書小文字[]

U+30EE

JapanistではU+F7EF

1457 縦書小文字[]

U+30F5

JapanistではU+F7F0

1458 縦書小文字[]

U+30F6

JapanistではU+F7F1

1459 縦書小文字[]

U+3095

JapanistではU+F2BB

1460 縦書小文字[]

U+3096

JapanistではU+F2BC

1461―1665 なし

U+FFFC


1466―1476 グラフ模様

U+FFFD

Japanistではprivate use area

1477 []

U+2192

JapanistではU+F2C1

1478 []

U+2190

JapanistではU+F2C2

1479 []

U+2191

JapanistではU+F2C3

1480 []

U+2193

JapanistではU+F2C4

1481 []

U+33CC


1482 []

U+3305


1483 [½]

U+00BD

JapanistではU+F7FF

1484 [¼]

U+00BC

JapanistではU+F7FE

1485 強調制御記号

U+FFFC

JapanistではU+F21C

1486 消しゴム制御記号

U+FFFC

JapanistではU+F21D

1487―1490 グラフ線

U+FFFD

Japanistではprivate use area

1491―1494 グラフ模様

U+FFFD

Japanistではprivate use area



10:OASYS独自文字とUnicodeの対応(15)

OASYS区点コード

Unicode Scalar Value

備考

1501―1594 制御記号

U+FFFC

グリフ、拡大縮小、割り付け、見出しを表す制御記号

Japanistではprivate use area









OAS”ファイル形式

現在解析中です。

FMT”ファイル形式

未解析です。

OA2”ファイル形式

未解析です。

OA3”ファイル形式

未解析です。



FG5”ファイル形式

対象としません。



BH2”ファイル形式

対象としません。

OASYSOpenOffice.orgの書式の対応

現在検討中です。OASYSの持っているMicrosoft Wordへの変換対応を基に対応表を作るのが基本となります。ただし、OASYSは見出し、段落のような機能は無く、タイプライタに近い書式を持っているため、対応が難しい変換が沢山あります。

付録

リンク