The Demopædia Encyclopedia on Population is under heavy modernization and maintenance. Outputs could look bizarre, sorry for the temporary inconvenience
多言語の人口統計学辞書 日本語 ed. 1994
22
|
|
220
もともとその目的のために企画されたものではない書類から統計データを得るという方法は、抽出1と呼ばれる。一般に、そのデータ源が何であれ、統計情報を得るためには人手による3か、機械による4か、電算機による5か、あるいはそれらの組合わせ方式によるデータ処理2が必要になる。手集計は、卓上計算機6よりも複雑な機械を使わないで行うデータ処理の方法である。機械集計では、製表機(224-2)またはパンチカード(224-3)機を使用する。電算集計では、コンピューター(132-2*)を使用する。データ処理の方式とはかかわりなく、データの編集8、製表(130-6*)、計算(132-3)、および統計表作成9を含むデータ作成作業7を行う必要がある。これらの作業は、選択されるデータ処理の方式によって複雑になったり、そうでなかったりする。
- 1. 抽出extraction(名);抽出するextract(動)。
- 2. 処理processing(名);処理するprocess(動)。
- 8. 編集editing(名);編集するedit(動)。英語では、この用語は、基本的な書類上あるいは機械読み取り可能データ上における不一致の補正、または漏れの除去のために行われる作業をいう。フランス語では、編集は製表の段階をいう。
221
通常、データの編集に先立ち、基本的書類2の上で、一定数の記載事項について符号づけ1が必要である。符号づけの設計3によって、記載事項と数字またはアルファベット符号への変換との間に対応関係が確立される。符号表(コード・ブック)は、特定の基本的書類に用いられる符合づけの設計をまとめ、記述したものである。符号づけの設計は通常、後で行うデータの仕分けを容易にするように考案されている。対照的に、分類4は個々の符号の一覧表である。この表では、各見出し5は一個または数個の数字で示される。データが符号づけされた後、それらは機械読み取り可能用紙に変換できるファイル(213-3*)にまとめられる。編集の第2段階では、内容検査7と整合性検査7による誤りの除去を行うことによって、ファイルのクリーニング6を行う。これらは、各統計単位(110-1参照)内の内部的査照によるか、あるいは異なる統計単位との比較によって行われる。誤りが見つけ出された後、それらはもとの書類上あるいはファイル上で、自動的手続きを通じて修正される。
- 1. 符号code(名);符号づけをするcode(動);符号づけcoding(名)。
222
編集されたデータそのものは、直接にはほとんど用いられない。そのデータはグループ分け(130-7)され、そして製表(130-6*)される。そして、これは通常、統計表(131-4)の形に表章される。これらは、人力または機械のいずれかによるソート(仕分け)1によって行うことができるが、これによって、事前に決められた規則に従って一連の事象単位の再構成、あるいはもっと単純に、特定の属性をもつ事象単位の系統的な計上が行われる。事象単位や属性の選択は、一つあるいは数個の数量的属性の値、あるいは一つあるいは数個の質的属性における固有の特性2に基づいて行われる。ほとんどの研究は、単純なものであれ複雑なものであれ、あるいは1回だけのものであれ繰り返しのものであれ、一連の計算なしには行われない。そして、コンピューター(225-2)は今や、人力では時間の掛かりすぎる計算を可能にする。これらの可能性は、データ分析3の技術の発展をもたらした。決定論的および確率論的モデル(730参照)はかなりの計算を必要とするし、シミュレーション(730-6)も同様である。
- 1. 仕分けsorting(名);仕分けするsort(動)。
223
製表(220-9)の段階は、データ処理の結果を一覧表1、統計表(131-4)あるいは統計図表(155-2)といった形で簡便に利用できるようにするためのものであり、それらはすべて記述統計2で共通に用いられている。コンピューター・グラフィック化3やコンピューター地図化3によって、予備的段階における大量のグラフ表現を可能にする。
224
純粋な意味での機械による処理(220-4)には、電子機器1の利用は含まれなかったが、それはかつての製表機2や記録機2に取って代わるものとなり、しかもずっと多目的なものになっている。多くの場合、情報にはまず符号づけ(221-1*)が行われ、次に穿孔機4を用いてパンチカード3に転記される。カード穿孔検査機5は、穿孔の正確性を検査するために用いられる機械である。コンピューターへのデータの入力方法としてはパンチカードがまだ利用されているので(訳注)、これらの2種類の記録機が、一般的に用いられている。一方、カード分類機6や製表機7のような他の記録機の利用は減少してきている。パンチカードに頼らず、データを直接磁気テープ(226-4参照)や磁気ディスク(226-5参照)に入力することが多くなっている。
- 3. パンチカードpunch cards、punched cards。
- 4. キイパンチkeypunchまたはカードパンチcard punch
(訳注)1970年代後半の時点で。
225
人口学の研究は、コンピューター(電算機)2を用いたデータの電算処理1に大きく依存している。ハードウェア3という用語はその物理的機器装置を指し、ソフトウェア4は、コンピューターを使う方法を利用者5に提供するものである。コンピューター専門家6には、システム・アナリスト9が構想したプログラム8を実際に書くプログラマー7も含まれる。
226
コンピューター(225-2)のハードウェア(225-3)部分は、1個または数個の中央処理装置1、1個の中央記憶装置2、磁気テープ4や磁気ディスク5を用いる一つ以上の大容量記憶装置3、1組の入出力装置6から成り立っている。ソフトウェア(225-4)の部分は、利用者(225-5)が利用者のプログラム9を運用するために使う施設8を効率的に管理するためのオペレーティング・システム7と、標準的な問題を解くために考案された既製のプログラム(225-8)であるデータ処理プログラム10から成り立っている。
227
利用者(225-5)は、フォートラン、コボル、ベーシック、あるいはアルゴルのような一般的なプログラム言語1や特定の言語でプログラム(225-8)を書くことによって、課題を処理することができる。これらの言語は、データバンク2を創り出し維持するのに使われるデータベース管理システム2、調査データ処理プログラム3、あるいは統計パッケージ4のような、コンピューターの中央記憶装置(226-2)に保管されるデータ処理プログラム(226-9)を使うために考案されたものである。情報をコンピューターに入力し結果を得るために用いられる方法は、データ処理の方式に応じて異なることがある。バッチ処理7では、普通の入出力装置は、カード・リーダー5とライン・プリンター6である。コンソール8は、タイム・シェアリング方式9におけるデータ処理のための普通の入出力装置である。いずれの場合においても、入力装置はコンピューターとは場所的に離れている場合があり、これらの条件の下でのデータ処理は、遠隔の端末装置10によって達成される。
- 1. 上に定義されたプログラム言語に加えて、他の種類の言語が、オペレーティング・システムを操作するのに用いられることがある。これらは通常ジョブ制御言語job control languageといわれる。
228
コンピューターで処理されるいかなる情報も、三つの主要な局面を経過する。第1は、データのエントリー1または入力1である。これは、パンチカード(224-3*)を用いるか、あるいはコンソール(227-8)のようなオンライン2による方法によって行われる。コンピューターにすでに保管されているデータは、中央記憶装置(226-2)からか、あるいは大容量記憶装置(226-3)の一つから得ることができ、入力データとして用いられる。第2の局面であるデータ処理(220-2)は、二つの主要なタイプ、すなわち数値処理4と非数値処理5とに区分される。統計的あるいは算術的計算は、通常前者に含まれる作業である。一方、データの加工操作の作業は、後者の主要なものである。しばしば、出力の段階といわれる第3の局面においては、処理結果6またはアウトプット6は、ライン・プリンター(227-6)上で印刷され、あるいは後の段階でのデータ処理のために大容量記憶装置(226-3)上でファイルに保存されることもある。処理結果をグラフや画像の形で得るために、結果はまた、プロッター7に転送されることもある。
* * *
|