みんなに優しく、解りやすくをモットーに開設しています。 以下のルールを守りみんなで助け合いましょう。
1.ファイルメーカーで解らない事があればここで質問して下さい。 何方でも、ご質問・ご回答お願いします。 (優しく回答しましょう)
You are not logged in.
Pages: 1
win8.1 FMP11です。
ある参加名簿ファイルにID、姓、名、姓よみ、名よみ、所属県の各フィールドがあり、
同一者のレコードが複数あります。同姓同名もたぶんあります。
レコード中には同一者でIDがある人、ない人が混在しており、他のレコードにIDがある同一者で当該レコードが
空白の場合は同じIDに一括置換したいと思っているのですがアイディアが浮かびません。
同一者は同姓同名を考慮するため姓、名、所属県の計算フィールドでリレーションを考えていますが、
同一者でありながら登録時に斉藤、齋藤や、高橋、髙橋など字体が異なるケースもあるため「よみ」も
考えなければないのか…などと、考えがまとまりません。
ご教授いただければ幸いです。
Offline
レコード数がわかりませんが、、
取り合えず、
姓
名
所属県
あたりでソートして、そのリストを見てみたらいかがでしょう。
Offline
総レコード数が42,000件で内、IDがないものが8,000件ほどあります。
レコード数が大したことなければ手動で十分なんですが、機械的に、正確に、処理したくて
相談させていただきました。
Offline
せめて県でなく住所でないと、同姓同名の別人かどうかは判断できないですよね。
説明不足で申し訳ありませんが、東北6県に限られた参加名簿ですので、同姓同名の数はそれほど多くはないです。
姓、名、所属県で絞って、仮に同姓同名者がいたとしてもそちらを確認した方が、効率が良さそうです。
Offline
> 同一者でありながら登録時に斉藤、齋藤や、高橋、髙橋など字体が異なるケースもある
読みでもいいでしょうが、よみも濁点など入力間違いがよくあります。必ずしも正しくはないです。
齋や髙を、斉、高に置き換えた計算フィールドを作り、それで照合すると少しだけ楽になります。
Last edited by Shin (2021-10-29 09:40:18)
Offline
あげられたフィールドだけでは同姓同名の異人の区別はつけられないですよね。
区別できるフィールドがあるのならFMでできるでしょうが、
なければ目視で判断となりますよね。
そのためにはソートが有効ですよ。
Offline
「字体が異なるケースもある」
別人だからなのか、単なる入力ミスなのかわからないので、結局個別に関連レコードを表示させて見ていくしかないのでは。
異体字を同一とみなす検索やリレーションはできないので、読みで照合しないとだめかな。
もともと正確でないデータを「機械的に、正確に、処理」は無理でしょう。
みなさん、ありがとうございます。返信遅くなりました。
結論から申し上げますと完全一致者のみ重複検索をかけたり、所属県や生年月日(未申告でした)などを
たよりに計算フィールドを作成したりして、最後に「目視」で確認、調整しました。
おそらく見落としもあるでしょうが…
なんでも機械的には無理ですね。痛感しました。
Offline
> おそらく見落としもあるでしょうが…
> なんでも機械的には無理ですね。痛感しました。
この作業を名寄せといって、日本では非常に難しい作業のひとつです。
有名なトラブルとして、かなり昔ですが、郵便貯金の名寄せを行った時に、氏名、生年月日をもとに行ったらしいのですが、全く同じ人がいて、その情報を一人にまとめてしまい、大問題になったようです。
私も今の仕事場で数年前に2万人ほどのデータベースを整理しましたら、従来が毎年新しいファイルを作っていく、直近でデータがあればそのまま継続する、という面倒な運用だったため、数カ月かけて名寄せしましたが、今でも、非常に古い人では重複がみつかることがあります。
いくら目視確認しても、最終的には、実運用の中でその人に直接あたって確認していかないと、完全には無理なのでしょうね。
Offline
Pages: 1
[ Generated in 0.008 seconds, 10 queries executed - Memory usage: 563.07 KiB (Peak: 567.95 KiB) ]