知識ベースによる販売予測法の改良法と 出版増刷支援システム

人工知能学会第2種研究会資料
SIG-KST-2009-03-04(2010-03-04)
知識ベースによる販売予測法の改良法と
出版増刷支援システム
“The Cluster Grouping Approach for NM Forecasting Model
Its Publishing Support System”
田中謙司 1, 宮村幸宏,鈴木慎太郎
Kenji Tanaka, Yukihiro Miyamura, Shintaro Suzuki
東京大学大学院工学系研究科システム創成学専攻
Department of Systems Innovation, Graduate School of Engineering, The University of Tokyo
Abstract: 新製品の販売推移は、販売後に急増しその後突然ピークアウトする。この需要変動は、機会損
失と廃棄ロスを大量に発生させてきた。本研究では、専門家の知識を活用する NM 予測法に改良を加え、
更にそれを用いた出版支援システムを提案する。出版支援システムにおいては、様々なノウハウを市場流
通量などのパラメータで表現する。これら手法を2出版社における実験を通じて検証し有効性を確認した。
Keywords: forecast, book sales, knowledge utilization, k-means
1. はじめに
21 世紀に入り消費財市場は、高度成長期の大量消費
から、消費者ニーズの多様化が進展した少量多品種
のへと変化した。デジタル家電など多くのメーカー
は、次々と新製品を投入して市場を刺激することで
市場変化に適応し、製品ライフサイクルは大幅に短
縮された。販売期間が短くなったことで、販売総数
に対する過剰在庫数の割合は大きくなり、その最終
的な製品在庫廃棄率が、製品のライフサイクル収益
を大きく左右するようになった。その廃棄率に決定
的な影響を与えているのは需要予測に基づく生産計
画である。生産過剰になれば、最終廃棄コストが収
益を下げ、過少になれば店頭在庫不足による機会損
失を発生する。そのような業界における生産計画数
およびそのタイミングの決定は収益管理上極めて重
要な事項である。Agrawal and Schorling[1]は、計画決
定における需要予測の精度が最終的な収益に大きく
影響することを示した。その重要性とは対照的にそ
の予測の困難さと精度の低さによってこれまで予測
を用いた実用的な収益管理はなされてこなかった。
Mentzer and Bienstock[2], Chu and Zhang[3]が指摘し
ているようにロングセラー製品のような販売既存の
確立した予測法は傾向には確立した線形予測手法は
に限定されるため、不安定かつ非線形な挙動を示す
あるものの、発売直後の新製品の予測は不安定かつ
非線形で予測は困難である。これに対してニューラ
ルネットワークによる予測法などが研究されてきた
ものの、予測精度制度が安定しない、設定準備が、
事前の設定準備に多くの手数を必要とするためアイ
テム数の多い製品などでは普及するまでには至って
いない(Callen et al[4], Kirby et al[5])。したがって、
「経験と勘」に基づく決定に頼ってきているのが現
状である。そのため在庫廃棄率は、デジタル家電業
界や書籍流通業界のように販売総数の 4 割以上に達
する場合も存在し、業界全体に深刻な影響を及ぼし
ている。
書籍業界を取り巻く環境の変化や出版業界の商習
慣、構造的特徴がもたらす弊害により、近年出版業
界は厳しい困難に直面している。出版物の売上は
1996 年をピークに減り続けており、2009 年には 21
年ぶりに書籍と雑誌を合わせた売上高が 2 兆円を割
る事態となった。また、返本率は 40%前後を推移し
ており、改善が望まれているものの未だ効果的な策
が打ち出されていない。
このような状況を改善するために、業界各プレイ
ヤによるデータ共有と、科学的な未来予測に基づく
経営システムを提供する目的で BBI(Book Business
Innovation)プロジェクトが進められている。本研
究はこの一環として行われた。BBI プロジェクトと
は返品率 40%に代表される書籍流通の非効率を業
界全体最適の観点から効率化し、業界すべてのプレ
イヤの利益向上を図る試みとして、東京大学、書籍
卸会社、およびエンジニアリング会社が共同で進め
田中謙司 東京大学大学院工学系研究科システム創成学専攻 助教
東京都文京区本郷 7-3-1 e-mail:kenji_tanaka@sys.t.u-tokyo.ac.jp
*)本資料の著作権は著者に帰属します。
ているものである(図 1)
。このプロジェクトにおい
て予測法が開発され利用されているが、本研究は、
更に予測精度を必要とする商材に関して、エキスパ
ートによるグルーピングを、クラスタリング手法を
用いて改良し、出版社支援システムへ実装すること
を目的とする。
出版社
取次
書店
顧客
4000 社
17,000 書店
…..
…
販売予測
返本率2割
統合データ
図1
BBI プロジェクトコンセプト
グループから除外することで予測精度を向上させる
というアプローチである。
異常タイトル判定には、販売傾向を表す指標として、
売上到達日数(Sales Accomplished Day,以下 SAD)
を定義し、これを用いる。SAD は、ある期間におい
て、期間内の総売上数に対して p %売上を達成する
のに要する日数である。p はグループの特徴によっ
て変更可能な SAD の変数であり、p を考慮する場合
は特に SAD(p)と表す。あるグループにおいて、
「SAD(70)<60」という条件でフィルタリングを行っ
た結果を図 2 に示す。SAD の閾値と p を変化させる
ことでさまざまなフィルタリングが可能であるため、
これらを変更させて最もよい精度が期待できるフィ
ルタリングを採用する。最適なパラメータを決定す
るまでの流れを、図 3 に示す。
2. 販売予測法の改良
2.1
NM 予測法
NM 予測法とは、田中ら[6]により改良アプローチ
が研究された販売予測法で、逓減型の販売傾向を示
す商材の予測に適性がある。これは、販売流通プロ
セスが同一であり、商材の種類も似ているグループ
では累積販売傾向が類似していることを利用して、
N 日目までの累積販売数にから将来の累積販売数を
予測する手法である。その基本概念は図.1 に示す。
NM 予測法における予測精度は、販売傾向の類似し
たグループを作製すること、予測対象商材を販売結
果が判明する以前に所属するグループへ所属させる
ことに影響する。田中らは、エキスパートの知識を
用いた書籍ジャンルグルーピングを採用することで
一定の実用精度を確保した。
7日-365日累積売上冊数分布 (文庫ジャンルの例)
y = 2.85x
R 2= 0.8185
予測
365日目の累積販売数
1000
N日
500
7日目の累積販売数
1000
N日目とM日目の累積販売数は相関がある
M日
(冊)
N日目の実績からM日目の累積販売数を予測する
図. 1 NM 予測法の基本概念
2.2
図 3
定法
2.3
0
0
SAD(p)によるフィルタリング結果
NM予測
(冊)
2000
図2
フィルタリングによる改良
グループ内の販売傾向のばらつきは大きくないが、
大きく販売傾向の異なる少数のタイトル(異常タイ
トル)が含まれている場合、それらの異常タイトルを
SAD フィルタリングによる最適パラメータ決
クラスタリング手法による改良
グループ内のばらつきが大きいグループでは、グ
ループ内でクラスタリングを行い適切なグループを
生成することにより予測精度の向上を目指す。本研
究では、
(ア) 販売傾向によるクラスタリング
(イ) 初版部数によるクラスタリング
(ウ) 初版部数と販売傾向のクラスタリング
という 3 つのクラスタリング手法を試みた。
販売傾向によるクラスタリングとは、対象グループ
に対して SAD を用いた k-means 法によりクラスタリ
ングを行い、生成されたグループで NM 係数を算出
する。そして予測時には、まず予測時点以前から予
測時点まで各クラスタの NM 係数を用いて予測を行
い、誤差の最も小さいクラスタを採用する。採用さ
れたクラスタの NM 係数により、予測時点から予測
目標日までの販売予測を行う方法である。この手順
を図 4 にチャートで示す。また、初版部数によるク
ラスタリングとは、初版部数により事前に所属クラ
スタを決定する手法で、初版部数と販売傾向による
クラスタリングとは、これらを組合せた手法である。
2.4 増刷推奨システム
出版経営では不適切な増刷により過剰在庫を抱え
てしまう傾向にある。そこで、本研究の販売予測法
を用いた増刷推奨するシステムを開発した。本シス
テムでは週次で更新されるデータから販売数予測を
行い、それに基づき時期に合わせた増刷推奨を提供
する。システムの概要を図 5 に示す。
図5
増刷推奨システム概要
3.本手法の検証
3.1
シミュレーションによる検証
本研究で示す販売傾向クラスタリングを採用した
販売予測を行い、増刷推奨で示された数の増刷シミ
ュレーションを行った。対象は中堅ビジネス出版社
2 社の 2006-2009 年に出版された全タイトルを用い
る。累計推奨印刷実績と販売実績を用いて時間進行
の再現シミュレーションから効果を検証する。印刷
のリードタイムは 2 週間とした。
3.2
誤差±30%以内タイトル割合
(予測時点-予測日)
既存手法との比較検証
50%
グループ1
45%
+12%
40%
40%
33%
30%
30%
20%
14日-182日
20%
10%
10%
0%
0%
中分類
60%
50%
+9%
46%
70%
55%
予測
q日目までの販売数を
k個のクラスタにより予測
発売後p日目
3×
2
クラスタ2を適用
30日-182日
30%
20%
20%
10%
10%
0%
0%
中分類
90%
80%
70%
+12%
傾向3クラスタ
79%
p
q
m 日数
n
予測
クラスタ判定
決定したクラスタにより
m日目を予測
発売後n日目(n≧q)
図 4 販売傾向クラスタリングを用いた予測の手順
傾向3クラスタ
87%
79%
70%
60%
50%
40%
40%
60日-182日
30%
30%
20%
20%
10%
10%
0%
傾向4クラスタ
平均11%の精度向上
図6
+8%
90%
80%
67%
0%
発売後q日目
中分類
100%
50%
最も精度のよいクラスタを採用
クラスタ1
66%
40%
p日時点の予測の精度を評価
クラスタ2が
× 最も近い
傾向3クラスタ
50%
30%
大分類
○
+3%
63%
60%
60%
実績
修正NM中分類
傾向4クラスタ
40%
まず、予測法の検証を行う。既存手法ではグルー
ピングはエキスパートによる分類の大分類、中分類、
および、それぞれのフィードバック修正 NM 法[6]
と合わせて 4 種類を準備する。これらのうち最も良
いものとクラスタを用いた予測手法の比較を図 6 に
示す。
グループ247%
39% +8%
50%
中分類
傾向3クラスタ
平均6%の精度向上
既存予測手法と本研究の予測手法との比較
ここでグループ 1、2 とは出版社 A、B を示す。量
出版社の結果においても 11%、6%と 30%誤差ないタ
イトルが増加し、本研究の予測手法の有効性を示す
ことができた。
3.3
出版支援システムの検証
出版支援システムの再現シミュレーションの結果、
返本は、全体で 35%、218,267 冊削減した。返本数削
減の効果を、図 6 に示す。増刷を行ったタイトルに
限れば、返本冊数を 56%削減することができた。
2.
(冊)
700,000
3.
600,000
-218267(冊)
500,000
397776
400,000
実増刷ありタイトル
返本数合計
173509
300,000
全体で約35%減少
増刷ありタイトルでは
約56%減少
を開発することで、既存の NM 予測法が抱えて
いた問題点を解決し、6-11%の予測精度向上を
達成した。
開発した予測法をもとに、出版社における出版
経営システムを構築した。さらに、実データに
よるシミュレーションの結果、35%の過剰在庫
削減できる可能性を示した。
出版社における実証実験を実施し、実際にシス
テムが運用できることを示し、さらにその結果
7 割以上のタイトルを予測精度 30%以内という
予測精度が達成された。
200,000
実増刷なしタイトル
返本数合計
[1] Agrawal, D., Schorling, C., Market share forecasting: An
empirical comparison of artificial neural network and
multinomial logit model,, Journal of Retailing 72(4),
220718
100,000
226718
383-407(1996)
[2] Mentzer, J.T., Bienstock, C.C., Sales Forecasting,
0
現状
推奨
Management. Sage, Thousand Oaks, CA.(1996)
[3] Ching-Wu Chu, Guoqiang Peter Zhang, A comparative
図6
システム適用による返本削減効果
study of linear and nonlinear models for aggregate retail
sales forecasting,
3.3
実証実験
2010 年 1 月より 2 ヶ月間、取次会社とビジネス中
堅出版社 2 社との共同実験により、本システムによ
る週 2 回の増刷推奨を提供する実証実験を行った。
その結果による予測精度の検証を図 7 に示す。短期
間の実験ので、返本数の削減の検証が困難なため目
標は、7 割以上のタイトルを予測精度が 30%以内に
することであった。これは返本率 40%より小さくす
ることを目的とした。図 7 に示すように、実験の結
果 A、B 両社ともその目標が達成されている。
Int. J. Production Economics 86,
217–231(2003)
[4] Callen, J.L., Kwan, C.Y., Yip, C.Y., Yuan, Y., Neural
network forecasting of quarteryly accounting earnings.
International Journal of Forecasting 12, 255-267(1996)
[5] Kirby, H.R., Watson, S.M., Dougherty, M.S.,Should we
use neural networks or statistical models for short-term
motorway traffic forecasting?, International Journal of
Forecasting 12, 43-50(1997)
[6] Kenji
Tanaka,
Shoji
Takechi,
Knowledge
based
Forecasting for Non-linear Trend Products, Proceedings
of the ISPE
International
Conference Concurrent
Engineering(2009)
[7] 宮田秀明, 田中謙司, 佐藤一郎, 西陽一「増刷推奨処
理システム」, 特願 2007-127052, 平成 19 年 5 月 11
日出願
[8] 宮田秀明, 田中謙司, 佐藤一郎, 西陽一「販売予測シ
ステム、方法、及び、コンピュータプログラム」, 特
願 2007-10795, 平成 19 年 1 月 19 日出願
図7
各予測目標日における予測精度の検証
4.結論
本研究の結論は以下の通り
1. データのフィルタリング、クラスタリング手法