pythonの辞書

pythonで連想配列やマップに相当するものは、辞書 (dictionary) です。ユニークな(重複できない)キーに対して値を対応させるものです。キーと値をkey,valueとしておきます。値という言葉を変数の値などで使用することがありますのでそれと区別するためです。

keyやvalueの型を予め決める必要はありません。項目ごとに混在させられます。マニュアルには「ハッシュ可能 (hashable) な値を任意のオブジェクトに対応付ける」とあります。

pythonにはmapという名前の関数がありますが、これはJavaなどのMapとは別物です。リストの各要素に指定した関数を適用する関数です。

辞書の生成とvalueの変更・項目の追加

keyとvalueの組を辞書の項目といいます。key:value を項目としてコンマで区切り、{ }の中に並べ辞書の生成と初期値の代入をします。

辞書名[key]でvalueの参照です。keyがなければ KeyError になり、プログラムが停止します。

辞書名.get(key[, default])メソッドでも参照できます。辞書内にkeyに一致するものが存在しなければdefaultを、defaultも省かれていれば None を返します。

辞書名[key]=value でkeyがすでに存在すればvalueの変更、しなければ項目追加になります。

""と''はpythonではどちらを使っても同じと言われますが、print(辞書名)では' 'で表示されます。

valueの型は混在可

ここではvalueの方に様々な型の変数やオブジェクトを格納できることを示します。簡単にするためkeyはすべて文字列にしています。

"num"のところを見ると、keyに同じものがあると後に書いたものでvalueが上書きされることもわかります。

keyの型も混在可

次にkeyの方に様々な型を使ってみます。実用では、文字列か数値(それも整数)を使うことになると思いますので、半分はお遊びの実験です。簡単にするためvalueはすべて文字列にしています。

前半では数値と文字列を区別することが確かめられます。22と"22"は別のものです。

変数をkeyにすると、変数の値をkeyにすることがわかります。[ ]に計算式を入れると計算結果がkeyになります。

プログラム中にもコメントに出力を書きましたが、実行結果は

keyの型も混在可-その2

「ハッシュ可能 (hashable) な値」の禮として、int, str, tuple, frozenset が挙げられていたのでtupleを使ってみます。これらは、immutableなので hashableなのですが、今のところは使ってみるにとどめます。

リストや辞書は keyにすることができません。TypeError: unhashable type: 'dict' などと叱られます。

プログラム中にもコメントに出力を書きましたが、実行結果は

intやStringと同様な動きをします。ただ、文字列のタプルでは ' ' でないと同一と判断してもらえない様です。" " でも ' ' でも同じと聞いていたので意外です。

for文で繰り返し

Java同様Keyだけ、valueだけ、key-valueの組の集合を得る方法があり、それを一つずつ処理することができます。

得られる「集合」はリストやタプルではなく、それぞれ 'dict_keys'、'dict_values'、'dict_items' と別々のクラスのインスタンスです。

辞書の項目順序

バージョン 3.7 で辞書の項目の順序が挿入順のままに固定されるようになったとのことです。3.6まででは次のように変わってしまいます。

連想配列に感動した昔

連想配列に出会ったのは1993年のことでした。UNIX上のawkでした。

次のような名前と数値が組になったデータから、名前ごとの合計を出すというものです。

END以下は結果の表示のためのforで、計算の本体は連想配列 sum[$1] += $2 です。 $1がkey、$2が値でkeyが同じ場所に値を加算するものです。

Pythonの辞書を使ってやってみる

Pythonでもファイルから一度に全部を読む方法がありますからファイルが大きくない場合はこれを使います。Javaでは、Files.readAllLines(path)でしたが、Pythonでは、ファイルオブジェクト.readlines() です。

データファイルは、上記の onion 50\n carrot 226\n carrot 315\n... とスペース区切りのテキストファイル。onion.txt という名前でプログラムを実行するディレクトリに置きます。今回はわざと226の前にスペースを2つ入れています。

データは\nがついたまま行ごとのリストになってlinesに格納されます。

split()で引数を略して空白文字(\nも\tもその連続にも対応する)で区切り、key,valueのタプルにします。split()の戻値はリストです。lineが空行だったり、(k,v)でなかったりすることは想定しません。

get(k,0)はkを探して、vを得ますが、辞書にkが含まれなてときは0を返します。このメソッドのおかげでJavascriptやJavaよりawkに近いものになっています。

for文は上で3種を示したので、ちょっと変えてitems()をtupleで受け、format % values の valuesに使うという方法を取りました。printf 形式のformatはあまり好きではないですが、Javaでも同様にできるのでここではこれを採用しておきます。

薄い色にした部分は、処理途中の確認のためです。改行や空白文字など動作確認が必要なものが多くありました。残しておくほうが参考になると考えました。

Pythonの辞書を使ってやってみるその2

withを使ったファイルのopen、空行などのチェック、printf似でなくformatを使った書式出力を取り入れてもう一つ例を出しておきます。

データファイルにありがちな空行の混入で作業が止まらないよう対策しました。 key valueと1行に2つの文字列がない場合には無視して進みます。これは良いことか悪いことかは事情によります。

1行に3つ以上ある場合は、前の2つを採用して残りを無視します。これも良いことか悪いことかは事情によります。

str.format()を使ってみました。sがデフォルトになっていたり、右寄せ、左寄せのデフォルトが自然だったりとなかなか良さげです。

存在確認・削除などの操作の実際

命令文/関数でできていた昔風のものと、オブジェクト指向からくるメソッドが混在してスッキリしません。戻値を積極的にもたせない様です。

存在確認・削除などの操作の一覧

全部ではありませんが、調査したものを一覧にしておきます。

その他の操作(一部)
操作	使用例	対象が存在しない時		対象が存在する時
操作	機能	動作	戻値	動作	戻値
clear	`dic`.clear() 辞書の全ての項目を消去	NameError	-	消去	-
len	len(`dic`) 項目数を返す	NameError	-	-	項目数
in	key in `dic` dicにkeyが存在すればTrue。そうでなければFalse。	-	False	-	True
not in	key not in `dic` dicがkeyが存在しなければTrue。存在すればFalse	-	True	-	False
get	`dic`.get(key[, default]) keyがあればvalue、なければdefaultを返す	-	default	-	現在のvalue
[]	`dic`[key]='value' keyがなければkey:valueを追加。あればvalueの更新	追加	-	valueの更新	-
setdefault	`dic`.setdefault(key[, default]) keyがあればvalueを返し、なければdefaultを返しkey:defaultを追加	追加	Default(None)	-	現在のvalue
del	del `dic`[key] dic から keyと対応するvalueを削除	KeyError	-	削除	-
pop	`dic`.pop(key[, default]) keyが存在すればvalueを返してkey:valueを削除。しなければ default を返す	-	default	削除	以前のvalue