vpx/x86 at a5e97d874b16ae5826b68515f1e35ffb44361cf8 - vpx - Atria-soft GIT

generic-library/vpx

History

Scott LaVarnway a5e97d874b VP9_COPY_CONVOLVE_SSE2 optimization

This function suffers from a couple problems in small core(tablets):
-The load of the next iteration is blocked by the store of previous iteration
-4k aliasing (between future store and older loads)
-current small core machine are in-order machine and because of it the store will spin the rehabQ until the load is finished
fixed by:
- prefetching 2 lines ahead
- unroll copy of 2 rows of block
- pre-load all xmm regiters before the loop, final stores after the loop
The function is optimized by:
copy_convolve_sse2 64x64 - 16%
copy_convolve_sse2 32x32 - 52%
copy_convolve_sse2 16x16 - 6%
copy_convolve_sse2 8x8 - 2.5%
copy_convolve_sse2 4x4 - 2.7%
credit goes to Tom Craver(tom.r.craver@intel.com) and Ilya Albrekht(ilya.albrekht@intel.com)

Change-Id: I63d3428799c50b2bf7b5677c8268bacb9fc29671

2015-07-31 14:51:51 -07:00

..

convolve.h

Code refactor on InterpKernel

2015-07-31 10:27:33 -07:00

fwd_dct32x32_impl_avx2.h

Factor 32x32 fwd DCT to vpx_dsp folder

2015-07-28 11:13:41 -07:00

fwd_dct32x32_impl_sse2.h

Replace vp9_ prefix in 2D-DCT functions with vpx_

2015-07-28 16:06:44 -07:00

fwd_txfm_avx2.c

Replace vp9_ prefix in 2D-DCT functions with vpx_

2015-07-28 16:06:44 -07:00

fwd_txfm_impl_sse2.h

Replace vp9_ prefix in 2D-DCT functions with vpx_

2015-07-28 16:06:44 -07:00

fwd_txfm_sse2.c

Replace vp9_ prefix in 2D-DCT functions with vpx_

2015-07-28 16:06:44 -07:00

fwd_txfm_sse2.h

Move forward dct sse2 header file to vpx_dsp

2015-07-27 14:59:57 -07:00

fwd_txfm_ssse3_x86_64.asm

Replace vp9_ prefix in 2D-DCT functions with vpx_

2015-07-28 16:06:44 -07:00

highbd_intrapred_sse2.asm

Replace prefix vp9_ with vpx_ for intra prediction functions

2015-07-27 13:42:06 -07:00

highbd_loopfilter_sse2.c

Rename loop filter function from vp9_ to vpx_

2015-07-17 15:55:02 -07:00

highbd_quantize_intrin_sse2.c

Refactor vp9_idct.h file

2015-07-26 08:26:32 -07:00

highbd_sad4d_sse2.asm

Move shared SAD code to vpx_dsp

2015-05-06 16:58:20 -07:00

highbd_sad_sse2.asm

Move shared SAD code to vpx_dsp

2015-05-06 16:58:20 -07:00

highbd_subpel_variance_impl_sse2.asm

Don't use 'h' for functions using x86inc.asm

2015-07-28 14:00:32 -07:00

highbd_variance_impl_sse2.asm

Move variance functions to vpx_dsp

2015-05-26 12:01:52 -07:00

highbd_variance_sse2.c

Clean out more MSVC warnings

2015-07-08 15:09:20 -07:00

intrapred_sse2.asm

Replace prefix vp9_ with vpx_ for intra prediction functions

2015-07-27 13:42:06 -07:00

intrapred_ssse3.asm

Replace prefix vp9_ with vpx_ for intra prediction functions

2015-07-27 13:42:06 -07:00

loopfilter_avx2.c

Rename loop filter function from vp9_ to vpx_

2015-07-17 15:55:02 -07:00

loopfilter_mmx.asm

Rename loop filter function from vp9_ to vpx_

2015-07-17 15:55:02 -07:00

loopfilter_sse2.c

Rename loop filter function from vp9_ to vpx_

2015-07-17 15:55:02 -07:00

quantize_sse2.c

Migrate quantization functions from vp9/ to vpx_dsp/

2015-07-17 16:38:14 -07:00

quantize_ssse3_x86_64.asm

Migrate quantization functions from vp9/ to vpx_dsp/

2015-07-17 16:38:14 -07:00

sad4d_avx2.c

sad*_avx2.c: sync function signatures

2015-05-14 20:58:56 -07:00

sad4d_sse2.asm

Move shared SAD code to vpx_dsp

2015-05-06 16:58:20 -07:00

sad_avx2.c

sad*_avx2.c: sync function signatures

2015-05-14 20:58:56 -07:00

sad_mmx.asm

Move shared SAD code to vpx_dsp

2015-05-06 16:58:20 -07:00

sad_sse2.asm

Move shared SAD code to vpx_dsp

2015-05-06 16:58:20 -07:00

sad_sse3.asm

Move shared SAD code to vpx_dsp

2015-05-06 16:58:20 -07:00

sad_sse4.asm

Move shared SAD code to vpx_dsp

2015-05-06 16:58:20 -07:00

sad_ssse3.asm

Move shared SAD code to vpx_dsp

2015-05-06 16:58:20 -07:00

subpel_variance_sse2.asm

Don't use 'h' for functions using x86inc.asm

2015-07-28 14:00:32 -07:00

subtract_sse2.asm

Move subtract functions from vp9 to vpx_dsp

2015-07-06 12:22:47 -07:00

txfm_common_sse2.h

Refactor vp9_idct.h file

2015-07-26 08:26:32 -07:00

variance_avx2.c

Move sub pixel variance to vpx_dsp

2015-07-07 15:51:04 -07:00

variance_impl_avx2.c

Move sub pixel variance to vpx_dsp

2015-07-07 15:51:04 -07:00

variance_impl_mmx.asm

Move sub pixel variance to vpx_dsp

2015-07-07 15:51:04 -07:00

variance_mmx.c

Move sub pixel variance to vpx_dsp

2015-07-07 15:51:04 -07:00

variance_sse2.c

Move sub pixel variance to vpx_dsp

2015-07-07 15:51:04 -07:00

vpx_asm_stubs.c

Code refactor on InterpKernel

2015-07-31 10:27:33 -07:00

vpx_convolve_copy_sse2.asm

VP9_COPY_CONVOLVE_SSE2 optimization

2015-07-31 14:51:51 -07:00

vpx_high_subpixel_8t_sse2.asm

Code refactor on InterpKernel

2015-07-31 10:27:33 -07:00

vpx_high_subpixel_bilinear_sse2.asm

Code refactor on InterpKernel

2015-07-31 10:27:33 -07:00

vpx_subpixel_8t_intrin_avx2.c

Code refactor on InterpKernel

2015-07-31 10:27:33 -07:00

vpx_subpixel_8t_intrin_ssse3.c

Code refactor on InterpKernel

2015-07-31 10:27:33 -07:00

vpx_subpixel_8t_sse2.asm

Code refactor on InterpKernel

2015-07-31 10:27:33 -07:00

vpx_subpixel_8t_ssse3.asm

Code refactor on InterpKernel

2015-07-31 10:27:33 -07:00

vpx_subpixel_bilinear_sse2.asm

Code refactor on InterpKernel

2015-07-31 10:27:33 -07:00

vpx_subpixel_bilinear_ssse3.asm

Code refactor on InterpKernel

2015-07-31 10:27:33 -07:00