Skip to content

データサイエンス100本ノック(構造化データ加工編) - SQLのS-030とS-031の回答に使用されている関数について #133

@yuiki-iwayama

Description

@yuiki-iwayama

S-030

設問

S-030: レシート明細テーブル(receipt)に対し、店舗コード(store_cd)ごとに売上金額(amount)の標本分散を計算し、降順でTOP5を表示せよ。

回答

%%sql

SELECT store_cd, var_pop(amount) as vars_amount
FROM receipt
GROUP BY store_cd
ORDER BY vars_amount desc 
LIMIT 5

設問では標本分散を求めるようになっていますが,回答は母分散の関数であるvar_popを使用しています.
標本分散の場合は,var_sampを使用するのではないでしょうか?

S-031

設問

S-031: レシート明細テーブル(receipt)に対し、店舗コード(store_cd)ごとに売上金額(amount)の標本標準偏差を計算し、降順でTOP5を表示せよ。

回答

%%sql

SELECT store_cd, stddev_pop(amount) as stds_amount
FROM receipt
GROUP BY store_cd
ORDER BY stds_amount desc
LIMIT 5

設問では標本標準偏差を求めるようになっていますが,回答は母標準偏差の関数であるstddev_popを使用しています.
標本標準偏差の場合は,stddev_sampを使用するのではないでしょうか?

posgresqlのドキュメントでも母分散と標本分散,および母標準偏差と標本標準偏差は明確に区別されているようです.
ご確認お願いします.

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions