星期一, 12月 02, 2019

IQA - Image Quality Accessment



https://zhuanlan.zhihu.com/p/32553977




图像质量评价的数据库很多,各种失真类型针对各种图像,但公认度最高的还是前四个,即LIVE, CSIQ, TID2008和TID2013,这些库都提供了每幅失真图像的主观评分值MOS,也就是ground truth。原始图像数量都差不多,前两个库都是针对常见失真类型为主,即加性高斯白噪声、高斯模糊、JPEG压缩和JPEG2000压缩,而TID2013包含失真图像数量有3000幅,主观实验打分人数是917人,权威性当然是最高的,但由于失真类型数量高达25种,同时也是最难的。LIVE和CSIQ两个库可以做到很高了,目前FR IQA的主要战场是TID的两个库(BIQA还是只能在LIVE和CSIQ上玩玩,TID就惨不忍睹了)。下面两个表分别是数据库大致情况,和分别包括的失真类型,这里提到失真类型,是因为后面要用到。
https://xialeiliu.github.io/RankIQA/

https://live.ece.utexas.edu/research/quality/subjective.htm

H.R. Sheikh, M.F. Sabir and A.C. Bovik, "A statistical evaluation of recent full reference image quality assessment algorithms", IEEE Transactions on Image Processing, vol. 15, no. 11, pp. 3440-3451, Nov. 2006.

SSIM

Z. Wang, A.C. Bovik, H.R. Sheikh and E.P. Simoncelli, "Image quality assessment: from error visibility to structural similarity," IEEE Transactions on Image Processing , vol.13, no.4, pp. 600- 612, April 2004.

lec-1 (2022-05-12) Accelerating deep learning computation & strategies

雖然用 DNN train/predict model 也好一陣子了,但這週才是第一次搞懂 cuDNN 是作什麼的 以前好奇過 tensorflow/pytorch 是怎麼做 convolution 的,FFT 不是比較好嗎? 下面的 reference 就給了很好的解釋: Wh...