バックナンバー

社長コラム
バックナンバー一覧はこちら
コラム29 現場的統計手法その1 アウトプットデザインから始めるコペルニクス的転換 2012.1.20

新年から硬いお話で恐縮ですが、現場的統計的方法についてご説明します。


このコラムでも過去に触れた事がありますが、農業においては、個体間のバラつき(個体間差異)が非常に大きくて、そのために、他の産業よりも切実に統計的処理が必要となります。ここに大きな構造的な落とし穴と誤解があるように感じます。

即ち、あまりにも個体間のバラつきが大きい事実を意識しすぎるために、より沢山の(解析できっこない)生データを探るだけとって立ち往生してしまったりするケースがよく見受けられます。そして、最終的には、「統計的」という言葉によって「数Ⅲ」の世界を連想して「思考停止」「立ち往生」に陥ってしまうのかも知れないなあ・・と勝手に決め付けたりしています。


ここに、農学者のための統計的手法活用の手助けとして書かれた名著「スネデカー・コクランの統計的手法」(岩波書店1972年)があります。

全546ページに及ぶ大著ですが、決して、これを全部理解する必要はありません。

しいてあげれば、

(1)表10.2.1

1元分類

(2)表10.8.1

最小有意差(LSD)

(3)表11.4.1

2元分類(a処理、b反復をもつ2元表の代数的表現)

(4)表12.3.1

2×2要因実験の解析

の4つを理解すれば十分だと考えます。

もっと言うと、(4)は使用頻度が極めて少ないことから、(1)(2)(3)だけで十分といえるでしょう。


では、具体的な事例をもって、「統計的手法」の呪縛から解放される、コペルニクス的転換を伴う、現場的方法を説明しましょう。

例題)ポットカーネーションの新品種Aと既存品種B(対照)の主要な農業特性の違いにつき把握するために試験設計を組んで、その違いを明らかにしようとする。

回答例)貴方が担当者であれば、いくつかの農業特性につき比較をしたいはずです。ですので、まずは、この試験設計アウトプットをイメージする事から始めます。

STEP1:アウトプットのイメージ検討


第1表 アウトプットのイメージ
品種    特性草丈株張1輪開花日3輪開花日
新品種A32.018.24月22日5月1日
既存品種B(対照)27.515.74月24日5月3日
解析結果***n.s.n.s.

このアウトプットのイメージは至極重要です。
ほとんどの失敗事例、特に「思考停止事例」は、このアウトプットイメージが無い事に起因します。
さらに、表中に(統計的)解析結果を示してあげる事がとても重要です。
例えば、草丈を例にとると、品種Aの32.0と品種Bの27.5は、「品種Aの草丈が高い」と言ってよいレベルの違いなのか?あるいは、大差ないと判断できるレベルなのか?が最も現場的なクエスチョンだからです。
ここで、統計的手法の登場です。
**は1%水準で有意(極めて強く違うと断言して良い)
*は5%水準で有意(やや弱く違うと言えるレベル)
n.s. はNot Significant の略称で、違うと言わない(言えない)レベル を意味します。

よって、第1表を見た生産者の方は、以下のように、新品種Aをイメージするでしょう。

「草丈や株張りは既存品種Bより大きいけれども開花期(早晩性)は変わらない。」

このイメージを基に、具体的な肥料設計や栽植密度、出荷規格などの検討に入る事ができるのです。

このアウトプットイメージを最初に考える事こそ、これまで失敗続きだった方々にとっては、「コペルニクス的転換」かも知れません。


では、次の質問は、この32.0とか27.0 というデータをどうやって集めるのか?(STEP2)そして、そのデータをどうやって解析するのか(**とか*を算出するのか=STEP3)?というものになりますね。

これらについては次回以降、ご説明します。



2012年1月

代表取締役社長 清水 明

Dear customers;


I am sorry, but I would like to start of this management column 2012 by rather tough story which is statistics in agriculture business front.


As I already referred to several times in the past, in agriculture business in general, there exists rather big individual deviation among the population.

Thus, as conclusion, we need to use “statistical analysis” seriously, but I personally perceive there is a big structural trap and misunderstanding.


I guess one would like to pay attention towards the fact that there exists certain individual deviation and he often takes too many data and information to make analysis properly.

And finally and eventually, in such cases, one tends to be afraid the word of “Statistics” which reminds you one of the most difficult class in your high school days, which is “Mathematics grade Ⅲ”.


Hereby, I have a very good book namely “Statistical Methods” written by George W. Snedecor and William G. Cochran. which certainly helps agriculture researchers and business people to understand “Statics”.

This book consists of 546 pages, but I would like to emphasize that it is absolutely NOT necessary to understand all pages.

What I recommend is only to read the following parts.

My

(1) Table 10.2.1

One-way classification (p 247)

(2) Table 10.8.1

Least Significant Difference (LSD) (p259)

(3) Table 11.4.1

Two-way classification (p288)

(4) Table 12.3.1

2 times 2 factorial experiment (p326)


Then, let me proceed to explain the concrete example of “Statistical analysis” for your further understanding, which might be considered as “Copernicus like turning point”.


Example ) There is new pot carnation variety A. The task is to compare with the existing variety B as comparison and find out any different characteristics between them, if any.

Model answer ) If you were the person who shall conduct the task above, you would like to make an image of the design as output of this experimental plan.


STEP 1 : Consider the designed image of the output.


Table 1. Image of the output

Characteristics

Variety
Plant heightPlant sizeFirst flowering dateThree flowering date
New variety A32.018.222 APR1 May
Existing variety B27.515.724 APR3 May
Analysis***n.s.n.s.

This concept of “the designed image of the output” is extremely important.

  I personally guess that almost all failure in the process of “Statically analysis” derives from missing this kind of clearly designed image of output.

Additionally, what is essential is to put one line of computed “Statically analysis” in the table.
For example, I perceive from agricultural business front point of stance whether there is any significant difference between the plant height of variety A of 32.0cm and that of variety B of 27.7cm or not.

In short, if you were a grower of pot carnation, you can grasp such image of variety A as

- rather bigger plant height and plant size than variety B
- however, flowering time is similar with variety B

Having such image of variety A, you will start to consider concrete fertilization program, plant density or package size.

Again, I believe that to design the image of experimental output is crucial.


Then, the next question from you might be

- how to gather the required data like 32.0cm or 27.5cm <STEP2>
- and how to compute the outcome of analysis <STEP3>

I will come back to you in the next management column.



With Best Regards,

Akira Shimizu

前の記事を読む 次の記事を読む

Copyright 2016 Japan Agribio Company,Limited,All Rights Reserved.